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OBSERVACIONES AL ALUMNO 

Al comienzo de cada texto encontrará lo siguiente. 

1. UNA PRESENTACION DE NUESTROS OBJETIVOS en la unidad, la cual puede usar para comprobar si ha completado el 
curso satisfactoriamente. 

2. UN DIAGRAMA ESTRUCTURAL que le muestra cómo están relacionadas las diferentes secciones de la unidad. El diagrama 
consta de: 
a) cuadros rojos que muestran la secuencia principal. 
b) cuadros negros punteados (a la izquierda del rojo) que le muestran lo que esperamos ya sepa antes de fijarse un estudio 

detallado. 

e) cuadros negros (a la derecha del rojo) que le ayudan a escoger temas que puede posponer u omitir si tiene poco tiempo. 

3. UN GLOSARIO de las definiciones, notaciones, etc., usadas en la unidad como referencia inmediata. 

4. UNA BIBLIOGRAFIA de los libros que puede consultar cuando haya acabado el trabajo de la unidad. 

5. CONCLUSIONES Y RESUMEN del trabajo realizado al final de cada texto. 


NUMERACION E INDICADORES 

Dentro de cualquier sección nos referimos a los temas por medio de un número. Al referirnos al mismo tema en otra sección, citamos 
cuatro números: número de la unidad, número del capítulo o parte, número de sección y número del tema. Por ejemplo, “Ecuación 3” 
si aparece en la misma sección, y “Ecuación. 4.3.1.3”, si está en otra sección. Los tres primeros números se citan en la parte superior 
de la página. Creemos que este es un sistema claro y fácil para consultar cualquier tema. Los indicadores serán una guía valiosa 
y le ahorrarán tiempo. 

En la margen derecha del texto hemos tratado de indicar la clase del material. Los términos usados son tan claros que no necesitan 
explicación. Por ejemplo, “Discusión” significa que una vez que haya entendido el tema, no necesita de nuevo recurrir a esta parte 
del texto. Estos INDICADORES tienen por objeto ayudarlo a localizar rápidamente las partes importantes cuando esté repasando 
o tenga que omitir parte del texto por falta de tiempo. 

También hemos tratado de indicar la importancia de los temas por el sistema de estrellas. 

*** Esto es muy importante. Usted debe entenderlo claramente. En algunos casos lo usará con tanta frecuencia, que se familiari- 
zará con ello sin necesidad de memorizarlo deliberadamente. El punto principal de este curso es no aprenderse los datos de me- 
moria; nosotros creemos que es más importante que entienda el trabajo y sea capaz de aplicarlo en la solución de los problemas. 
** Este es de menor importancia, pero tiene material al cual nos referiremos más adelante. 

* Esto generalmente no lo guía a trabajos adicionales en este curso y lo puede omitir si tiene poco tiempo. 

M Indica el final de cada ejemplo, ejercicio o solución. 
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Objetivos 
En esta unidad se introducen las variables aleatorias, distribuciones de 


probabilidad y muestreo, todos ellos son elementos fundamentales de la 
estadística. 


Al finalizar el estudio de esta unidad el lector debe: 


(i) seleccionar el espacio muestral más adecuado para una situación 
(simple) dada; 

(ii) explicar el significado de la variable aleatoria y su dlsigibución de 
las probabilidades; 

(iii) explicar el significado de la expectancia de una variable aleatoria, 
y calcular la expectancia en casos sencillos; 

(iv) deducir la varianza de una distribución discreta simple; 
(v) comparar dos distribuciones en términos de sus medias aritmé- 
ticas y varianzas; 

(vi) explicar el significado de una distribución muestral, y distinguir- 
la de la distribución patrón de probabilidad; 

(vii) utilizar la estadística del muestreo para estimar parámetros des- 
conocidos, y comparar la adecuación de estadísticas diferentes con 
este propósito, en los casos simples; 

(viii) deducir la forma teórica de la distribución binomial como un caso 
particular de distribución muestral; 

(ix) buscar la media aritmética y la varianza de la distribución bino- 
mial. 
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Glosario 
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La desviación típica de una distribución es la 
raíz cuadrada positiva de una varianza de la 
distribución (o de la variable aleatoria). 


La distribución binomial es la distribución de 
probabilidad en la cual: 


n 
P(X = r) = ro == pr” 


(r =0,1,...,n), donde n y p son parámetros. 


Una distribución de probabilidad de una va- 
riable aleatoria X es una función: 


ap = 1,2058): 


El dominio de la función es un espacio mues- 
tral numérico [a,, a,, ... , 4,), donde la pro- 


babilidad asociada con a, es p,(r=1,2,...,n). 
(Por las leyes de probabilidad tenemos que 
0 < P, < 1 (r = 1,2, ...) n), y 

Y au 

r=1 
Se escribe 


P(X =a,) = pr =1,2,...,1). 


La distribución del muestreo es la distribu- 
ción de probabilidad de una estadística del 
muestreo. 


Una estadística del muestreo es una variable 
aleatoria basada en una muestra aleatoria y 
no en el resultado de una prueba individual. 


Una estimación de un parámetro es la reali- 
zación de una estadística del muestreo utili- 
zada para calcular el valor del parámetro en 
cuestión. 


La media aritmética de la distribución de 
probabilidad es: 


Y 4,p,, 


r=1 


donde el espacio muestral es/a,, a., ..., a,) 
y a, tiene la probabilidad asociada p,(r = 
Vid 26 mat) 


Una muestra aleatoria desde una distribución 
es una secuencia de realizaciones de una va- 
riable aleatoria, que se obtienen en una serie 
de pruebas independientes. 


Un parámetro de una distribución de proba- 
bilidad es un parámetro matemático (ej. una 
constante arbitraria que distingue varios casos 
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específicos) que ocurre én la expresión de la 
distribución de probabilidad. 


Una realización de una variable aleatoria X 
es un valor numérico tomado por X en una 
prueba determinada. 


Un tasador de un parámetro es. una estadís- 
tica del muestreo cuya distribución del mues- 
treo está centrada sobre (o estrechamente 
agrupada alrededor de) el parámetro cuyo va- 
lor debe ser calculado. 


Dada la distribución de probabilidad P(X = 
a,) = p,(r =1,2, ...,n) y una función g 
con dominio ¡a,, a,, ... , 4,) el valor espera- 
do de g(X) es: 


n 


2 gla,)p,. 

r=1 
Una variable aleatoria es cualquier cantidad 
numérica cuyo valor está determinado por el 
resultado de una prueba, pero dicho resulta- 
do no se puede predecir. 


La varianza de una distribución (o de una va- 
riable aleatoria) es el valor esperado de g(X) 
donde 


g: X——(X — py 


y p es la media aritmética de la distribución 
(o de la variable aleatoria). 


vil 
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Notación 
Los símbolos se presentan en el orden en que aparecen en el texto. 
X Variable aleatoria. 


P(X = a,) La probabilidad que existe de que una variable alea- 
toria X tome el valor a,. 


E(X) El valor esperado de X. 

p El significado de una distribución (o de una variable 
aleatoria). 

E(g(X)) El valor esperado de g(X). 

var(X) La varianza de una distribución (o de una variable 
aleatoria). 

o La desviación típica de una distribución (o de una va- 


riable aleatoria). 


P(X > Y) La probabilidad que existe de que una variable alea- 
toria X tome un valor superior al de la variable alea- 
toria Y. 


Bibliografía 


El texto correspondiente se propone dar una información estadística 
completa, tratando de entrar lo menos posible en los detalles técnicos. 
Hasta el momento no se ha publicado un texto similar, por tanto es 
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Sin embargo, 


F. Mosteller, R.E.K. Rourke y G.B. Thomas, Probability with Statisti- 
cal Applications, 2a. edición (Addison-Wesley, 1961), y 


S. N. Collings, Theoretical Statistics: Basic Ideas (Macdonald, 1971), 


serán de gran ayuda en el estudio de tópicos determinados como son las 
variables aleatorias, distribuciones discretas, expectancias, medias arit- 
méticas y varianzas, distribución binomial. Ambos libros tratan los te- 
mas más allá del alcance de la Unidad 21. Mosteller introduce las dis- 
tribuciones de probabilidad continuas en el proceso; Collings profundiza 
más las secciones relacionadas con esta unidad. 
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21.0 INTRODUCCION 


En la Unidad 16, Probabilidad y estadística T estudiamos la naturaleza 
y manejo de datos sencillos, y en la Unidad 18, Probabilidad y estadís- 
tica IT hablamos de la probabilidad y sus reglas operacionales. Esta 
Unidad 21 se interesa principalmente en la estadística: aplicación de 
la teoría de probabilidad a situaciones concretas con miras a la inter- 
pretación de datos y sacar conclusiones. Las conclusiones se sacan 
siguiendo procedimientos estándar aprobados por la mayoría, aunque 
no todos los estadígrafos estén de acuerdo. La teoría estadística es 
el cuerpo de dichos procedimientos estándar. Por analogía, la teo- 
ría de la integración sería simplemente el cuerpo de los enteros 
estándar. Pero así como la teoría de la integración es algo más 
que la determinación mecánica de los enteros, así también la teo- 
ría estadística es algo más que el juego mecánico de las deduccio- 
nes. Sin una comprensión de las dificultades básicas de las ventajas y 
desventajas de los varios procedimientos, y de las suposiciones inheren- 
tes, es imposible hacer una buena selección entre los procedimientos 
posibles, o saber hasta qué punto las conclusiones obtenidas necesitan 
ser corroboradas. Una parte importante de la teoría estadística es la 
comprensión de dichos conceptos —y pocas veces forma parte de la ma- 
teria principal de los textos. La mayoría de los libros de estadística se 
concentran en los procedimientos estándar aunque, debemos admitir, 
que al final algo aparece sobre los problemas de base. Desafortunada- 
mente no disponemos, para el estudio de esta unidad, del tiempo sufi- 
ciente para cubrir, en forma adecuada, los procedimientos estándar, 
tampoco es nuestra intención hacerlo; preferimos, por razones válidas, 
profundizar los problemas de base. A lo largo de la unidad menciona- 
remos algunos procedimientos estándar con el único fin de ilustrar al- 
gunos puntos de las discusiones. 


Para hacer énfasis en la diferencia que existe entre los procedimientos 
estándar y una comprensión básica, tomemos una analogía de la indus- 
tria de vestidos. El vendedor debe conocer antes que todo su trabajo, 
es obvio que su conocimiento sobre vestidos sea bastante menor al del 
sastre, persona capaz de confeccionar un vestido a la medida. El sas- 
tre sabe tanto como el vendedor en lo que se refiere al vestido más 
apropiado para la ocasión, sabe además cómo se unen las costuras y es 
capaz de hacerle aquellas modificaciones que establecen la diferencia 
entre un vestido bien entallado y uno que no lo está. 


Nuestro propósito no consiste en presentar una tesis exhaustiva sobre 
los problemas de base, sino en demostrar que ellos existen. En cierta 
forma son más los problemas que nos planteamos que los que solucio- 
namos. Esto es compatible con la filosofía: estamos identificando los 
problemas lógicos y matemáticos que se originan al pasar de datos de- 
terminados a propiedades generales. Como en muchas áreas de la filoso- 
fía, las soluciones a estos problemas son frecuentemente contenciosas. 
Como se trata de discutir principios generales, no buscaremos cambiar 
el ambiente físico, por el contrario, permaneceremos en un terreno fa- 
miliar. Trabajaremos con dados una y otra vez, pero siempre habrá 
algo diferente, alguna actitud mental nueva para asimilar. 


Seguiremos utilizando los modelos matemáticos, pero en este caso se 
trata más bien de modelos de probabilidad. Ya nos hemos familiarizado 
con el modelo de la urna (Unidad 18), en donde el extraer bolas alea- 
toriamente desde una urna es equivalente a seleccionar personas aleato- 
riamente, o a tirar un dado imparcial. Ahora, con las bolas en una urna 
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y un proceso dado de selección aleatorio (Unidad 18), podemos calcular 
la probabilidad de cualquier resultado o combinación de resultados; es 
decir, podemos aplicar la teoría de probabilidad. En la práctica, sin 
embargo, tenemos personas, dados, procedimientos para seleccionar las 
personas y tirar los dados. Pero no podemos saber con certeza si las 
operaciones físicas llevadas a cabo sobre objetos concretos están repre- 
sentadas con exactitud por el modelo de la urna. Para llevar adelante 
este proyecto limitémonos a un solo dado. Se dice que un dado es im- 
parcial si y solamente si: para un solo tiro el espacio muestral es 
11, 2, 3, 4, 5, 6), donde 


(i) la probabilidad de cada evento elemental es ¿; 
(ii) los eventos elementales son estadísticamente independientes. 


En el caso del dado imparcial, el modelo de la urna con 6 bolas nume- 
radas que son remplazadas después de la selección es una representa- 
ción fiel de la situación y no hay problema. ¿Pero será realmente im- 
parcial ese dado? En otras palabras, ¿será exacto el modelo para este 
dado? La única forma de saberlo es experimentando y observando, y lo 
primero que observamos es que es bastante difícil determinar una par- 
cialización. Supóngase que el dado no es imparcial sino que está parcia- 
lizado hacia el 6 de tal forma que la probabilidad de obtener un 6 es + 
y la de obtener cualquier otro número es 35. Esta es una parcialización 
relativamente importante hacia el 6, ella ha aumentado en un 50% la 
probabilidad de obtener un 6. Sin embargo, para obtener suficientes da- 
tos y poder discriminar entre un dado imparcial y uno parcializado, con 
un pequeño riesgo de errar en la decisión, se necesita tirar el dado cien- 
tos de veces. 


En la mayoría de los casos en los que el estadígrafo trata de interpretar 
datos no es posible una validación del modelo. Ello hace que con rela- 
tiva frecuencia el estadígrafo se vea obligado a utilizar su juicio y ex- 
periencia para construir un modelo, y su interpretación de los datos 
siempre tendrá aseveraciones explícitas o implícitas sobre “cuán co- 
rrecto es el modelo”. Los argumentos sobre la interpretación de la esta- 
dística casi nunca son sobre los cálculos, puesto que es muy fácil 
determinar si están o no correctos, sino sobre la validez del modelo so- 
bre el cual se basa la interpretación. Debido a que las investigaciones 
estadísticas versan casi siempre sobre motivos que desencadenan emo- 
ciones fuertes (por ejemplo, la controversia ampliamente discutida so- 
bre si fumar produce o no cáncer del pulmón), la verdadera naturaleza 
del argumento se pierde comúnmente. Como la validación del modelo, 
aun cuando se dispone de información suficiente, es generalmente un 
ejercicio estadístico sofisticado, el estadígrafo busca para la interpre- 
tación de los datos las implicaciones de los modelos simples; esta es la 
actitud adoptada en esta unidad. En las situaciones prácticas el esta- 
dígrafo experimentado puede tener reservas sobre su interpretación 
debido a las limitaciones del modelo. Esto no le impide, sin embargo, 
utilizar dicho modelo, el cual puede ser la única manera de lograr cual- 
quier interpretación. 


Supongamos que se tienen dudas sobre la exactitud del modelo de urna 
para representar un solo dado debido a que el evento (6 ) tiene una pro- 
babilidad superior a +. Si no conocemos la verdadera probabilidad, tene- 
mos que calcularla. Si al tirar el dado 1000 veces obtenemos un 6 en 
254 ocasiones, concluiríamos que la probabilidad de obtener un 6 es 1, 
y puede pensar que no hemos hecho suposiciones que dejen que desear. 
No se ha hecho ningún modelo de la situación; simplemente se ha lle- 
vado a cabo un experimento con una mente amplia, y de los datos ob- 
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tenidos se han sacado conclusiones. Pero, a pesar de las primeras apa- 
riencias, ¡sí hemos hecho nuestras suposiciones! Hemos supuesto que: 


(i) la probabilidad de un 6 es constante; es decir, es independiente del 
número de tiros anteriores del dado; 


(ii) el evento (6) es estadísticamente independiente de los otros eventos 
elementales; es decir, la probabilidad de obtener un 6 es indepen- 
diente de los resultados obtenidos en los tiros anteriores. 


Sin embargo, todas estas son suposiciones, y pueden no ser válidas: (i) 
puede ser falso si el dado está muy gastado por el uso; (ii) puede ser 
falso si la tabla está ligeramente húmeda de manera que la última cara 
que estuvo en contacto con la superficie está más pegajosa que las 
demás. Si no hacemos esta clase de suposiciones apenas sí podremos 
empezar a analizar los datos para sacar conclusiones. 


En conclusión, no podemos prescindir de las suposiciones y la construc- 
ción de modelos. Es por esto que debemos desarrollar un sexto sentido 
hacia la materia, y aprender por experiencia cuáles son y cuáles no son 
los modelos aceptables, en una situación dada. 


Pasemos, luego de estas consideraciones generales a situaciones parti- 
culares e ideas. 
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21.1 VARIABLES ALEATORIAS Y SUS 
DISTRIBUCIONES 


21.1.0 Introducción 


En la Unidad 18, Probabilidad y estadística II, vimos cómo la idea de 
un espacio muestral cuyos elementos (puntos) representan todos los 
resultados posibles de un ensayo es fundamental para el estudio de la 
probabilidad y de la estadística. En probabilidad y estadística como en 
las otras ramas matemáticas las ideas sencillas solo nos permiten re- 
solver problemas sencillos. Para ahondar un poco más es necesario un 
conocimiento matemático más profundo que puede, en un principio, 
aparecer como si nos estuviéramos alejando de los problemas concretos 
que nos interesan. Antes de empezar a desarrollar métodos más profun- 
dos y complejos vale la pena estudiar un ejemplo particular y ver por 
qué los conceptos sencillos de probabilidad no son los adecuados para 
tratar los problemas reales. 


21.1.1 Escogencia de un espacio muestral 


Supongamos que de una población de 20.000.000 de votantes, 9.000.000, 
(45%) apoyan al partido conservador, otros 9.000.000, (45%) apoyan al 
partido laboral, 1.000.000, (5%) al partido liberal, y otro 1.000.000 (5%) 
otros partidos. Aun con una idea meramente intuitiva de la naturaleza 
de la probabilidad, la mayoría de la gente aceptaría el enunciado que 
establece que la probabilidad de encontrarse “un hombre en la calle” 
que apoye el partido conservador es de 0,45. Recordando lo dicho en 
la Unidad 18, podemos imaginar un espacio muestral en 20.000.000 de 
puntos, cada punto representa un votante y todos tienen la misma pro- 
babilidad. Por tanto la aseveración “un hombre en la calle apoya al par- 
tido conservador” está formada por 9.000.000 de puntos que representan 
los miembros del partido conservador, y la probabilidad de este evento 
está dada por: 9 x 10%/20 x 10% = 0,45. El hacer esto en forma ex- 
plícita deja en claro la suposición que implica la frase “un hombre en 
la calle.” Con esta frase no estamos haciendo alusión a un votante al 
cual se le acerca un entrevistador de la televisión que se ha parado en 
una esquina determinada, sino a un votante escogido en forma cientí- 
fica, lo que hace que todos los votantes tengan la misma posibilidad de 
ser escogidos. Suponiendo que la selección de “un hombre en la calle” 
ha sido hecha en forma científica, la manera como se ha definido el 
espacio muestral no es única. Si nuestro propósito consiste en registrar 
las probabilidades que existen de escoger las cuatro clases de votantes, 
basta con considerar un espacio muestral de cuatro puntos marcados: 
conservador, laboral, liberal, otros, con las probabilidades asociadas 
0,45, 0,45, 0,05, 0,05 respectivamente. 


Por tanto, los puntos en el primer espacio se unen a los puntos en el 
segundo espacio, y cualquier descripción disyuntiva de los resultados 
de un experimento particular será delineada en forma semejante con el 
espacio muestral básico. Por ejemplo, si solo estamos interesados en los 
conservadores y no-conservadores, un espacio muestral de dos puntos 
es más que suficiente. El espacio muestral apropiado para una prueba 
dada depende no solamente de la prueba sino también de su finalidad. 
La idea de posibles espacios muestrales disyuntivos, y del espacio 
muestral .apropiado a una situación determinada va más allá de la 
definición elemental que se estudió en la Unidad 18, donde el espacio 
muestral era simplemente el conjunto de todos los resultados posibles. 
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Introducción 
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21.1.1 


Discusión 


Y e 


Espacio muestral 1 Espacio muestral 2 
(20.000.000 puntos) (4 puntos) 


38. 
8 


El problema se complica cuando queremos predecir el resultado de una 
elección en la cual sólo las $ partes de los votantes participan. Las ideas 
intuitivas sobre la probabilidad no son suficientes para hacer una pre- 
dicción significativa, aun cuando suponemos, al generalizar “el hombre 
en la calle” que todos los grupos posibles de 15.000.000 de votantes 
tienen la misma posibilidad de ejercer el derecho al voto. Si considera- 
mos a cada uno de los votantes como personas individuales y cada 
punto muestral de este experimento representa una selección diferente 
de 15.000.000 de votantes, el número de puntos en el espacio muestral 
resultante será del orden de 10>-""-0w, Es evidente que dicho espacio 
necesita ser reducido, o por lo menos simplificado, para que sea com- 
prensible. El espacio muestral con mayores posibilidades de describir 
en forma sencilla la situación de la probabilidad no es inmediatamente 
obvio, y en cualquiera de los casos no es único. Es necesario aclarar 
que por regla general no es posible separar la construcción del espacio 
muestral de la finalidad que se persigue. 


Por ejemplo, un avión puede tener dos llantas en cada tren de aterri- 
zaje. Supóngase que durante el aterrizaje se revienta una (o ambas) 
llanta. Esta falla puede estar ocasionada por un defecto en la manu- 
factura o por un desgaste particularmente severo debido a las condi- 
ciones de la pista. Marcando las dos llantas con 1 (izquierda) y D (de- 
recha), el estado de la llanta después del aterrizaje F (falló) y N (no 
falló), y la causa de la falla M (defecto en la manufactura) y G (des- 
gaste), los nueve resultados posibles del experimento durante el aterri- 
zaje del avión, son: 


(IFM; DFM) (IFM; DFG) (IFM; DN) 
(IFG; DFM) — (IFG; DFG) (IFG; DN) 
(IN; DFM) (IN; DFG) (IN; DN) 


Sin embargo, para el piloto de la nave, una división suficiente de los 
posibles resultados puede ser un espacio muestral con 3 puntos sola- 
mente: 


(i) ninguna de las llantas se reventó; 
(ii) solo una llanta se reventó; 
(iii) ambas llantas se reventaron. 


Por otro lado, para el fabricante de la llanta, un espacio muestral de 
dos puntos es más que suficiente: 
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(i) no hubo defectos de manufactura; 
(ii) uno o más defectos de manufactura. 


(En el segundo caso se puede estar expuesto a daños.) 


Para captar la clase de razonamiento necesario, ensaye el ejercicio si- 
guiente. 


Ejercicio 1 
Cuando el ascensor en un edificio de 9 pisos está detenido, sus puertas 
pueden estar abiertas o cerradas. 


(i) Si en un momento dado está detenido en un piso determinado, 
¿cuántos puntos tendría el espacio muestral que define la localiza- 
ción exacta del ascensor? (La “localización” del ascensor se refiere 
al piso en el cual se encuentra, y a saber si sus puertas están 
abiertas o no.) 

(ii) Si el ascensor está detenido en alguno de los pisos y no está traba- 
jando, el hombre encargado del mantenimiento debe llevar sus he- 
rramientas desde el primer piso hasta donde se encuentra el as- 
censor. Determine el espacio muestral apropiado para esta fina- 
lidad. 

(ii) Si es necesario un segundo para que las puertas del ascensor se 
abran o cierren y toma un segundo viajando entre un piso y otro, 
¿cuál es el espacio muestral que definiría en forma apropiada la 
localización del ascensor para una persona que oprime el botón de 
LLAMADA en el piso del medio? (En el sentido de cuántos segundos 
habrán trascurrido antes de que esta persona pueda entrar al as- 
censor), suponiendo que nadie más llama el ascensor. 


(SUGERENCIA: Encuentre el tiempo correspondiente a cada una de 
las localizaciones posibles). a 


Estas consideraciones se hacen más importantes cuando la probabilidad 
no es utilizada simplemente como un modelo descriptivo para una si- 
tuación concreta, sino como la base para los métodos estadísticos. Vol- 
viendo a los 20.000.000 de electores potenciales, para el estadígrafo la 
imagen sobre el comportamiento de los votantes descrito hasta ahora 
es simplemente una discusión preliminar del problema real. 


Aunque en esta unidad no pretendemos entrar en detalle en la solución 
de los problemas sobre el comportamiento electoral, vale la pena ob- 
servar la verdadera naturaleza del problema, para ver por qué el sencillo 
concepto de espacio muestral con sus probabilidades asociadas no es su- 
ficiente para habérselas con todo lo que el estadígrafo tiene que hacer. 


El estadígrafo no conoce, como lo supusimos anteriormente, las verda- 
deras proporciones de los diferentes tipos de votantes en la población. 
Si tiene suerte y es diligente, dispondrá de la siguiente información: 


(i) la dimensión total de la población votante por grupos de electores 
(tomada de las listas electorales), junto con los patrones de vota- 
ción de elecciones anteriores; 

(ii) la forma en la cual unos pocos miles de personas dicen que votarán 
(sacada de los escrutinios de opinión pública); 

(iii) el número posible de personas que votarán y cómo están distribui- 
das entre los partidos (con base en la experiencia pasada y a los 
escrutinios de opinión). 


La información en cada una de las tres categorías contiene incertidum- 
bres que pueden o no expresarse en términos de probabilidades. Tratar 
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Ejercicio 1 
(4 minutos) 


Discusión 
* 


de describir la situación en términos de un solo espacio muestral resul- 
taría, de ser posible, en una descripción tan complicada que sería inútil 
para fines de predicción. La necesidad de reducir esta clase de espacio 
muestral en un patrón de fácil manejo está más allá de la idea de una 
variable aleatoria, que discutiremos a continuación. 


21.1.2 Variables aleatorias 


Antes de definir una variable aleatoria vale la pena mirar otro ejemplo 
que ilustra en forma sencilla uno de los principales propósitos de nues- 
tra definición. 


Ejemplo 1 


Tenemos un dado corriente cuyas caras están numeradas de 1 a 6. Si 
tiramos el dado dos veces y registramos el número que aparece en la 
cara superior para cada uno de los tiros (como un par ordenado), un 
espacio muestral que contenga 36 puntos representará el conjunto de 
resultados posibles. Por consiguiente, el espacio muestral se puede re- 
presentar como sigue: 


(1,1) (1,2) (1,3) (1,4) (1,5) (1,6) 

(2,1) (2,2) (2,3) (2,4) (2,5) (2,6) 

(3,1) (3,2) (3,3) (3,4) (3,5) (3,6) 

(4,1) (4,2) (4,3) (4,4) (4,5) (4,6) 

(5,1) (5,2) (5,3) (5,4) (5,5) (5,6) 

(6,1) (6,2) (6,3) (6,4) (6,5) (6,6) 
Si suponemos que el dado es imparcial, entonces cada uno de los 36 
puntos tiene una probabilidad de z,. 


Si estamos interesados no en los resultados individuales, sino en los re- 
sultados totales que se pueden obtener al tirar dos veces el dado. 


.” E, > 
3 . . 


00 0 09) 09) ar ( 


15 (1,6)-- 
A RA “22).-(2,9).-- a ¡a Bs 
“ene Rae 0 cl (88)- 
ay y y 09 0 0D 
662 6 sy- 65 59- 
ona en-oye9 “es 


A A A A AA 


Los resultados totales van de 2 a 12, y el espacio muestral de 36 pun- 
tos puede (tal como lo indican las líneas diagonales en la formación an- 
terior) ser aplicado a un nuevo espacio cuyos puntos son los once nú- 
meros: 


23 97 4:9,6, 1,8, 9: 10, 11, 12, 


Aun utilizando el modelo del dado imparcial, los puntos en este nuevo 
espacio no tendrán la misma probabilidad. Un total de 2 sólo se puede 
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21.1.2 


Discusión 


Y '» 


Ejemplo 1 


(continúa en la página 8) 


Solución 21.1.1.1 


(i) Si se denota el piso con un número que vaya de l a 9, la puerta 
abierta con (a) y la cerrada con (c), obtenemos 18 puntos (1, a), 


(1, c), (2, a), (2, c), ... , (9, a), (9, c). 
(ii) Si solo estamos interesados en el piso, el espacio muestral tendrá 
Opuntos: 1,2, ..<:..3 De 


(iii) Los 18 puntos llevan a los tiempos correspondientes: 


(8, c) | (9, c) 
4 5 


La localización del ascensor se puede describir con sólo 7 puntos que 
representan los tiempos 0, 1, 2, ... , 6 segundos. di 


(continuación de la página 7) 


obtener de una manera como (1, 1), por tanto tiene una probabilidad 
de 3%. Por otro lado un total de 7 se puede obtener de seis maneras 
como (1, 6), (2, 5), (3, 4), (4, 3), (5, 2), (6, 1), la probabilidad de obte- 
ner un sotal. de 7 es la suma de las probabilidades de cada uno de estos 


resultados: 3% = ¿. 


Las ideas an en este ejemplo nos llevan a definir la variable 
aleatoria. 


Considere un experimento cuyos posibles resultados sean los números 
4A,, A, ... , An. Marcamos con una X un elemento general de este con- 
junto de números y llamamos a X la variable aleatoria Observe que 
hemos definido la variable aleatoria como un elemento general de un 
espacio muestral de números. Esto no significa que todos los otros ca- 
sos están “más allá del límite”. Puede haber alguna razón para aplicar 
elementos de un espacio muestral no numérico a valores numéricos. 
Por ejemplo, en un juego de cartas podemos no estar interesados en 
sentar una carta, entonces es posible aplicar el espacio muestral de 
52 cartas al conjunto (1, 2,3,... , 13); podríamos pensar luego en 
una variable aleatoria que tomara sus valores de este espacio muestral 
nuevo. 


Hemos tirado un dado tres veces y estamos próximos a tirarlo por 
cuarta vez; los valores obtenidos hasta ahora son: 2, 5, 4, y el de la 
cuarta ocasión lo desconocemos todavía. Podemos representar este va- 
lor desconocido por la variable aleatoria X que puede tomar cualquier 
valor en el conjunto (1, 2, 3, 4, 5, 6). 


Si en el cuarto tiro obtenemos un 3, decimos que 3 es la realización de 
la variable aleatoria en este caso (o que X toma el valor 3). De la mis- 
ma manera podemos decir que X tenía las realizaciones (o tomó los 
valores) 2, 5, 4 en los tres primeros tiros. Debemos mantener muy clara 
la distinción entre la variable aleatoria X cuando X representa un ya- 
lor desconocido 

y 

la realización de X donde X es un número específico 


Antes de hacer el cuarto tiro, nos interesa saber los valores que pueda 
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Solución 21.1.1.1 


Definición 1 


* * ¡$ 


Definición 2 


* $ * 


tomar X en esta ocasión; pero también estamos interesados en las pro- 
babilidades que tiene X de tomar estos valores. Para un dado imparcial 
X puede tomar el valor 1, la probabilidad de que así sea es de |. En 
una situación más general, el conjunto de resultados posibles en un 
ensayo puede ser el conjunto de números a,, a., ... , 4,). Si el resul- 
tado a, tiene probabilidad p,, y X representa el resultado de la prueba, 


entonces denotamos la probabilidad de que X tenga la realización a, 
por P(X = a,) lo escribimos 


P(X = a,) = p, 


Como dijimos anteriormente, algunas veces los resultados de las prue- 
bas que no son en sí mismos números tienen números asociados; en 
otras palabras, existe una aplicación (una función) que va del espa- 
cio muestral a los números reales R. En este caso es como si los núme- 
ros reales asociados fueran los resultados de las pruebas, de tal forma 
que estos números pueden ser representados por una variable aleato- 
ria. Hay que tener cuidado cuando esta aplicación no es uno a uno, por- 
que en general si E,, E., ... , E, son todos los resultados que se aplican 
aa(aecR), y X es la variable aleatoria que representa el número co- 
rrespondiente a cualquier prueba, entonces 


P(X = a) = P(E,) + P(E)) + --- + P(E,) 


Por ejemplo, si la prueba consiste en sacar una carta de un naipe y a 
los ases y figuras se les da un valor 10 mientras las otras cartas toman 
el valor que aparece marcado en ellas, entonces 


P(X = 10) = Pllas)) + PUK)) + PUQ) + PJ) + Plíídiez)) 


ll 
IS 


un] 
nl 


Otro tipo de situación en la cual los resultados son números dobles ocu- 
rre cuando los resultados son pares de números. Por ejemplo, si una 
prueba consiste en tirar los dados dos veces, los resultados son pares or- 
denados de enteros (u, v) donde l <u<6yl1< yv < 6. Si estamos 
interesados únicamente en el resultado total, lo obvio* es aplicar (u, v) 
aa = u +0, y tomar luego la variable aleatoria X teniendo como sus 
realizaciones todos los valores posibles de a. 


Veamos cómo trabaja esto para un dado imparcial. Solamente (1, 1) se 
aplica a 2. A 3 se aplican (1, 2), (2, 1) solamente; a 4 se aplican (1, 3), 
(2, 2), (3, 1) únicamente, y así sucesivamente. En nuestro modelo para 
dados imparciales cada resultado tiene una probabilidad de 3/, por 
tanto tenemos: 


* “No considere las matemáticas como difíciles y ásperas, y repulsivas al sentido común. 
Ellas son sencillamente la espiritualización del sentido común”. 


W. Thomson (Lord Kelvin) 
S. P. Thompson, Life of Lord Kelvin 
(Londres, 1910) 
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Notación 1 
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Ejercicio 1 


Para un dado imparcial que ha sido tirado dos veces, determine el con- 
junto S de posibles valores para la variable aleatoria correspondiente, 
junto con las probabilidades asociadas a estos valores si estamos inte- 
resados en: 


(i) el mayor de los dos resultados (o el resultado común a ambos si los 
dos son iguales); 

(11) la diferencia entre el primer resultado y el segundo: 
(primer resultado) - (segundo resultado) [0] 


Ejercicio 2 

En el ejercicio 21.1.1.1, el tiempo entre la oprimida del botón de LLA- 
MADA en el piso del medio y el momento en el cual pudo entrar en el 
ascensor el señor es una variable aleatoria. Si el ascensor tiene iguales 
probabilidades de estar en cualquiera de los 9 pisos, y la posibilidad de 
que la puerta esté cerrada es dos veces la de que esté abierta, deter- 
mine la probabilidad de cada uno de los valores posibles de la variable 
aleatoria. E 


21.13 Distribuciones de probabilidad 


Dado un ensayo con resultados numéricos asociados a,, 4., ... , 4,, he- 
mos introducido la variable aleatoria X y escrito 


P(X = a,) = p, (= LL 0085 n), 


donde p, es la probabilidad del resultado a,. Una vez conocidas las a y 
las p para cualquier ensayo, sabemos cómo la probabilidad total, a sa- 
ber 1, está distribuida sobre los resultados a,, 4,, ... , 4,. En términos 
más formales cuando tenemos las a y las p podemos definir una fun- 
ción que aplica a, a su probabilidad p,; la función tiene como do- 
minio el conjunto (a,, 4,, ... , 4,) y como codominio el conjunto de 
números reales R. A dicha función se le denominadistribución de pro- 
babilidad de la variable aleatoria X. (En realidad, sería mejor mirar el 
conjunto [a,, ... ,a,) y el conjunto de imágenes [P,, P», ... , Pn) como 
secuencias en lugar de conjuntos, porque estamos interesados en la dis- 
tribución de las p, de tal manera que cada una de las p, se repitan o no, 
sean de interés). 


La gráfica de dicha distribución de probabilidad puede representarse 
con un diagrama de barras; por ejemplo: 


¡l ill li 
qnN! 


E PE PE E 


El empezar con una prueba que tenga resultados numéricos asociados, 
nos lleva a considerar una variable aleatoria X, y luego la distribución 
de probabilidad de X, la cual se especifica en términos de los números 
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Ejercicio 1 
(3 minutos) 


Ejercicio 2 
(4 minutos) 


21.1.3 


Tema principal 
*k * * 


Definición 1 


* £ * 


a, y p,. Por el contrario, si tomamos cualquier valor a,(r = 1,2, ...,n) 
y p, que satisfaga 


0<p,<1 


= 
tl 
pun 


se puede concebir una variable aleatoria X que satisfaga 
P(X = a,) = p,. 


Dada una prueba con resultados numéricos asociados, el primer paso 
consiste generalmente en descifrar la distribución de probabilidad de la 
variable aleatoria X, que representa el resultado; esto se debe simple- 
mente a que queremos las probabilidades de los resultados individuales, 
o porque la probabilidad de la distribución está a medio camino hacia 
el hallazgo de algo más complejo. 


Ejercicio 1 


En una competencia sobre seguridad en carretera los promotores hicie- 
ron una lista de 10 accesorios (cinturones de seguridad, bombillas para 
niebla) que contribuyen a aumentar la seguridad en una carretera. A 
los competidores se les pide que escojan los 3 accesorios más efectivos, 
esta selección también fue hecha por un grupo de expertos. El compe- 
tidor escoge sus artículos seleccionando 3 bolas en una urna que con- 
tiene 10 bolas marcadas con los nombres de los accesorios. Si X repre- 
senta los accesorios escogidos tanto por el competidor como por los 
expertos, encuentre la distribución de probabilidad X. 


(SUGERENCIAS: ¿Cuál es el espacio numérico muestral? ¿Cuántas 
selecciones de 3 se pueden hacer con 10 accesorios? ¿Cuántas de estas 
tienen 0, 1, 2, 3 accesorios de los escogidos por los expertos?) m 


21.14 Propiedades simples de las distribuciones de 
probabilidad 


Si se lleva a cabo un ensayo cierto número de veces y se toma nota de 
los resultados, terminaremos con una lista de elementos tomados del 
espacio muestral. Si el espacio muestral consta de números, la lista 
será simplemente una lista de números. Esta lista se puede considerar 
como datos que deben ser analizados en forma similar a la utilizada 
para el análisis de datos en la Unidad 16, Probabilidad y estadística I; 
podemos calcular la media aritmética, la varianza, etc. El considerar 
estas medidas cuando el ensayo se hace muchas veces, nos lleva a de- 
finir ciertas medidas: media aritmética de la distribución, varianza de 
la distribución, etc. En esta sección iniciaremos el estudio de ellas. 


Valor esperado 


Supongamos que X es una variable aleatoria con una distribución de 
probabilidad asociada y definida por: 


P(A==:a;) =p, == n). 


MB 21.1.3, 21.1.4 


Ejercicio 1 
(4 minutos) 


21.1.4 


Introducción 


* * 


Tema principal 


* * 


(continúa en la página 13) 


Solución 21.1.2.1 


De la tabla dada en la página 7 tenemos: 
(i) Si X es el mayor de los dos resultados, entonces S = (1, 2, 3, 4,5, 6), y 


P(X =1)= 35, P(X =2)=3%, 
P(X =3) =3%, 
PX=5=%, PX =6=*H. 


(ii) Si X es la diferencia entre el primero y el segundo resultado, en- 
tonces S =([ —5, 5, —4, 4, —3, 3, —2, 2, —1, 1, 0), y 


P(X =-5)=%, P(X =5)= 3%, 
P(X =-4=%, P(X = 4) = +, 
P(X =-3)=36, PX =3)=3%, 
PX =-D=3%, PX =2=%, 
P(X =-1) =$ PX =1)=%, 
P(X =0) = Ñ 5 


Solución 21.1.2.2 


La probabilidad de que el ascensor esté en cualquiera de los pisos es 3, 
y en vista de que la posibilidad de que esté cerrado es dos veces la de 
que esté o la probabilidad de que la puerta esté amp en cual- 
quier piso es 3), y la probabilidad de que esté cerrada es 2,. Utilizan- 
do los resultados tabulados en la solución 21. 1.1.1. (iii) junto con estas 


probabilidades, tenemos: 
AEaEE 
e 
2 


e Pppp 


Solución 21.1.3.1 


21 


Como lo sugiere la última pregunta de sugerencias, el espacio numérico 
muestral es 0, 1, 2, 3). Podemos tomar como modelo una urna que 
contenga 3 bolas blancas (B) y 7 negras (N), las 3 bolas blancas repre- 
sentan los 3 accesorios seleccionados. Escogemos 3 bolas de esta urna 
de tal forma que todas las selecciones posibles tengan iguales oportu- 
nidades de ser escogidas. Si, para mayor conveniencia, consideramos 
que las bolas son diferenciables entre sí, tenemos 


Bis B., Ba, N,, N., Ns, N,, Ns» N., N.. 


El número de selecciones de 3 bolas de estas 10 es el número de posi- 
bles combinaciones de 3 objetos que se pueden hacer con 10 objetos; 


es decir, le = 120, todas ellas son igualmente posibles. El número de 


dichas selecciones que contienen: 


(i) ninguna bola blanca = formas de seleccionar 3 bolas de 7 negras, 


7 
es decir, (7) = 35. 
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Solución 21.1.2.1 


Solución 21.1.2.2 


Solución 21.1.3.1 


(ii) 1 bola blanca = formas de seleccionar 1 bola de 3 blancas y dos 
bolas de 7 negras; es decir, 


Ñ 
1 
(iii) 2 bolas blancas = formas de seleccionar 2 bolas de 3 blancas yl 
bola de 7 negras, es decir, 


[=[Jorer=a 


(iv) 3 bolas blancas de 1 exactamente. 


2 
«Y =3 2016 
2 


Por consiguiente, tenemos 


P(X =0) = Ho =% 
PX =1)=$%=4 
PX =2=$h =% 
P(X =3) = 1), 


(continuación de la página 11) 


Si en una serie de N ensayos encontramos que X toma el valor a, en 
m, ocasiones, a, en m, ocasiones, etc., el promedio de los valores toma- 
dos hasta ahora por X sería: 


M0, + M202 + -** + MO, 
N 


mi m, m 
= dry * aÑ od a 


m 5 . 
> es la frecuencia relativa con que ocurre el valor a,, y hemos aso- 


ciado la probabilidad de cualquier evento con la frecuencia relativa con 
que ocurre dicho evento a la larga. Por tanto es de esperar que + sea 
aproximadamente igual a p,. Igualmente esperamos que > sea apro- 


ximadamente igual a p., y así sucesivamente. Por tanto, es de esperar 
que el promedio de los valores tomados por X sea aproximadamente 
igual a Ñ 

1P1 + 42p2 +-=>- + 4,p,= ) 9,p, 


F= 
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Observe que N no aparece en esta expresión. Esta expresión se deno- 


minael valor esperado de X ; y lo representamos porE(X) o con la le- 
tra griega (“mu”). Por tanto tenemos: 


n 


E(X) = Y a,p, = y 
r=1 

a u se le denomina frecuentementela media aritmética de la distribu- 

ción . Otra forma de mirar a y es considerándola la media ponderada 

de a,, siendo la ponderada de a, la probabilidad con que ella ocurre. 


Ejercicio 1 


En la competencia sobre seguridad en carretera (ejercicio 21.1.3.1), de- 
termine el número posible de accesorios sobre los cuales estuvieron de 
acuerdo competidores y expertos. E 


Ejercicio 2 


Utilizando la distribución de probabilidad para el número de segundos 
necesarios hasta la llegada del ascensor, obtenida en el ejercicio 21.1.2.2, 
determine el valor esperado del tiempo de espera. [E] 


Aunque E(X) es el valor esperado de X, no es de esperar que una sola 
aleatoria X tome este valor, o aun que se le aproxime bastante. No es 
frecuente que una aleatoria X sea igual a y, algunas veces es imposible, 
como en los dos últimos ejercicios. Sólo aspiramos a que con un gran 
número de realizaciones de X de una misma distribución, su valor pro- 
medio se aproxime a u. Para un dado imparcial, el valor esperado de la 
variable aleatoria es 


6 6 
1 
Y ap, = rd 
r=1 r=1 
= 2 =3,5 


Conocer la media de la distribución es conocer algo, pero es un camino 
largo antes de conocer toda la distribución. Un dado no es necesaria- 
mente imparcial por el hecho de que el valor esperado del resultado 
sea 3,5. Por ejemplo, en un dado cuyo resultado esté representado por 
la variable aleatoria X, donde 


P(X = 1) = P(X = 6) = 


Hal 


P(X =2) = P(X = 3) = P(X = 4) = P(X =5)=%$ 


el resultado esperado es 3,5, pero está positivamente “cargado”. Para 
lograr una descripción más completa de la distribución de probabilidad 
es necesario conocer otras características y podemos obtenerlas hacien- 
do una aplicación más amplia del concepto de “valor esperado”. 


Introdujimos el concepto de valor esperado al hablar del valor espera- 
do de X; pero no hay razón para no considerar el valor esperado de X”, 
o de g(X) donde g es alguna función general con dominio (a,, 4», ..., 
a,) y codominio R. El valor esperado de X, por definición, está dado 
por 


n . 


E(X) = 2 4, 


r=1 
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Sa. 


Definición 2 
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Ejercicio 1 
(3 minutos) 


Ejercicio 2 
(2 minutos) 


Discusión 


* * 


Tema principal 


* * 


Por analogía, el valor esperado de g(X) está dado por 


Elg(X) = E slanp, 


porque si a, -— g(a,) y a, ocurren con probabilidad P,, entonces 
g(a,) ocurrirá con probabilidad p,. (No necesitamos preocuparnos si 
gla,) = g(a,), esto lo discutiremos después al hablar de la probabili- 
dad p,). 


Consideremos primero que todo E(X?). Si X es la variable aleatoria co- 
rrespondiente al resultado obtenido con tirar una sola vez un dado im- 
parcial, el valor esperado de X? es 


6 6 
MA = Frn= PARLA 
r=1 r=1 


Es claro que para cualquier variable aleatoria X no hay término a las 

funciones posibles de g, pero las funciones que tienen bien sea una in- 

terpretación física intuitiva o alguna utilidad matemática o estadística 

son relativamente pocas. Una tal función nos capacita para calcular 

la varianza* de la distribución. Consideremos g con dominio (a,, a., 
. , Q,), donde 


glX) =(X — Y, y =E(X). 
El valor esperado de (X — p)?, a saber 


E(X — 19) = Y (a, — 1», 


es llamado lavarianza de X , y ha sido representado con toda clase de 
símbolos en la literatura: notaciones de uso corriente sonvar(X) - E A 
y p* (o es la letra griega “sigma”). 


Desde el punto de vista de la computación es, con frecuencia más fácil 

hacer uso del resultado 
E(X — p)?) = E(X?) — y? 

(véase el ejercicio siguiente). 
Ejercicio 3 

(i) Pruebe que 

E((X — py?) = E(X?) — pe? 
(1i) Si X es una variable aleatoria que representa el resultado de un 


dado imparcial, determine la varianza de X. 
(11) Si el dado está cargado de manera que 


P(X =1)=P(X =6)=1 
P(X =2) = P(X = 3) = P(X =4) = P(X =5)=+4. 


determine el valor esperado (1) de X y la varianza de X. 

(iv) Si Y = cX + d donde c y d son constantes, determine una expre- 
sión para E(Y) = py en términos de E(X) = Le 

(v) En (iv) demuestre que la varianza de Y es el producto de c* y la 
varianza de X. q al 


* Véase la Sección 16.1.2 de la Unidad 16, Probabilidad y estadística 1. 
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Ejercicio 3 
(4 minutos) 


(continúa en la página 17) 
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Solución 21.1.4.1 Solución 21.1.4.1 


Utilizando los resultados del ejercicio 21.1.3.1, 


3 
E(X) = Y rx P(X =r) 


r=0 


=0x%4+1x4+2x%+3x 15% 


o 


— 21+1441 _ 9 
al 40 == TU 58 


Solución 21.1.4.2 Solución 21.1.4.2 


Utilizando los resultados del ejercicio 21.1.2.2, 


Por tanto, en promedio podemos calcular una espera de 34 segundos 
hasta la llegada del ascensor. EN 


Solución 21.1.4.3 Solución 21.1.4.3 


(1) E(X — 1?) y (a, — u)*p, 


= Y) (a? — 2ua, + p?)p, 


r=1 


!I 
M>= 


a?p, su 2 y a,p, + p? 3 Pr 
1 


r=1 r=1 r= 


= Y ap, 24 + O como 2 P-=1 y 2 Grp, =4 


r=1 


| 
a 
> 
E 
| 
+= 
tu 


Como es de esperar para una distribución uniforme, la varianza de 
X corresponde exactamente con la varianza del conjunto (1, 2, 3, 


4, 5, 6). 
(iii) EX) =4+£+4+3+6+3 
=i=p 
EX) =j+P+4+43+ 444 
=16 


de manera que 
E(X?) — p? = 16 - 


IS 


(iv) y = E(Y) = E(cX + d) 


r=1 


Y (ca, + d)p, [para Elg(X)) = Y gap, 
r=1 


Y p, 
=1 


=c Y ap, +d 
r=1 


= CE(X) + d 
=CHx +4 
En particular, hemos observado que cuando d = 0, E(cX) = cE(X). 
(v) var (Y) = E((Y — py)) 
= E((cX + d — cuz — d)) 
= E(c(X — px)?) 
= c? var (X) le 


AAAAAjñá——————_—__—_Q—_—a _—_—_——=—=— 


(continuación de la página 15) 


Ahora vamos a analizar qué interpretación (si existe) se le puede dar a 
var (X). Supongamos, como lo hicimos cuando discutíamos los valores 
esperados, que X es una variable aleatoria cuya distribución de proba- 
bilidad está definida por: 


AX =4)=p,  (r=1,2,...,n) 
Si una vez más llevamos a cabo una serie de N ensayos y encontramos 
que, de los resultados, 


los valores de m, son iguales a a,, 
los valores de m, son iguales a a, 


los valores de m, son iguales a a,, 


: m , 
entonces, como anteriormente, es de esperar que > sea aproximada- 


mente igual a p,. 


Para mayor conveniencia representamos los resultados de los N ensa- 
yOS por(X,, Xo, ... , Xy) y la media de este conjunto por x. Entonces 


n 


u =E(X)= Y a,p, 
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- la media de los resultados de los N ensayos (los valores x) considerados 
simplemente como información. 


Una vez más, var (X) = Y (a, — w*p, 
r=1 


“ (a, — py 
1 
N 


1 
14 


11 


(de lo dicho anteriormente) 
(xs > xy 
s=1 N 


varianza de los valores x considerados 
como información. 


En la Unidad 16 vimos que la varianza de la información se utiliza 
como medida de dispersión de la información; por tanto es de esperar 
que la varianza de la distribución sea una medida de dispersión de la 
distribución. “Dispersión” conlleva la idea de “anchura” o “extensión 
lineal”, pero la var (X) se obtiene como la suma de las expresiones de 
segundo grado. Por consiguiente utilizamos como medida de dispersión 


o (= /var(X)) en lugar de o? (= var (X)), y la denominamos desvia- Definición 4 
ción típica de la distribución. Por tanto ... 
E(X — uy?) =0 


= desviación típica 


En el ejercicio 3 encontramos que los dados imparciales y los cargados 
tenían las mismas medias pero diferían sus varianzas —y en consecuen- 
cia sus dispersiones eran diferentes. Pero no nos limitamos a observar 
pasivamente que diferentes distribuciones tienen diferentes dispersio- 
nes; este punto es de vital importancia en la teoría de la estimación 
que discutiremos en la Sección 21.2.3. 


Hasta ahora hemos elaborado un mecanismo para tratar con los mo- 
delos simplificados de los experimentos probabilistas. Estos mecanis- 
mos serán de utilidad más tarde en esta unidad, así como también en 
los próximos años. 


Comparando dos distribuciones 
Discusión 


En muchas situaciones de probabilidad nos encontramos con el proble- *o* 
ma de escoger entre uno y otro método de selección; entre un ensayo y 
otro; entre este u otro método para calcular un valor desconocido. Cual- 
quiera que escojamos, estaremos considerando siempre una u otra distri- 
bución, y con frecuencia tendremos que escoger entre varias distribu- 
ciones. ¿Cuál de las distribuciones es la más adecuada para nuestros 
propósitos? Aun presuponiendo los valores a,, siguen siendo necesarios 
n — 1 números para especificar la distribución (¿por qué no n?). Luego 
nos podrían dejar tratando de comparar dos distribuciones, cada una 
con n — 1 medidas. Debemos encontrar alguna manera de representar 
cada distribución con una sola medida. Es aquí donde entran en juego 
los valores esperados; en vista de que las distribuciones que encontra- 
mos con más frecuencia sólo tienen una media, podemos decidir fácil- 
mente entre dos distribuciones comparando sus medias (en el caso en 
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que la media sea una medida apropiada para el contexto). Si la media 
no es apropiada, quizás la varianza sí lo sea; si así es, tenemos una sola 
medida para propósitos de comparación. 

Ejemplo 1 


Supóngase que deseamos jugar una mano sencilla de dados con un con- 
tendor, y nos permiten escoger entre un dado imparcial cuya distribu- 
ción de probabilidad está dada por 


P(X =r)=1 (== 12.020) 
y un dado cargado cuya distribución de probabilidad está dada por 
P(Y = 1) = P(Y = 6) = 


1 

P(Y =2)=4 

P(Y = 3) = P(Y = 4) = 7 
P(Y =5)=3% 


Ambas distribuciones se pueden ilustrar con un diagrama de barras: 


dado imparcial dado cargado 


a. 


AÑ 
3 
¿ 
1 
3 
SE sy 
q 18 
Sr :6 


e 3 “€ 5 8 1.2 ARA 


Si el objetivo del juego consiste en alcanzar el puntaje más alto, ¿cuál 
de los dados debemos escoger? Es decir, ¿cuál de las distribuciones es 
la mejor? Podemos hacernos las reflexiones siguientes: 


(i) El 6 es un número muy bueno. La probabilidad de obtener un 6 

con un dado cargado es dos veces la probabilidad de obtener un 6 
con un dado imparcial, por tanto es mejor el dado cargado. 
Sin embargo, la probabilidad de obtener un 1 con el dado cargado 
es dos veces la de obtenerlo con el dado imparcial, y esto cancela 
la ventaja descrita anteriormente. Por tanto parece que debemos 
considerar toda la distribución de probabilidad para el dado car- 
gado, y no sólo parte de ella. 

(ii) Si consideramos toda la distribución para el dado cargado, es de 
seguro apropiado considerar el resultado de la media. Si el resul- 
tado esperado con el dado cargado es superior al del dado impar- 
cial, debemos escoger el primero. 

Para el dado imparcial, 


E(X) = 3,5 


MB 21.1.4 


Ejemplo 1 


Para el dado cargado, 


EY)=1xI+2x3+3x2+4x25+5x2%+6x3 


— (6+6+6+8+5+48) 
E 24 


= 31 = 3,375 < E(X). 


Ello hace que sea mejor el dado imparcial. 

(iii) El argumento (ii) parece apropiado, ¿pero será suficiente como 
para no considerar el asunto más allá? La única forma de saberlo 
es examinando todos los pares posibles de resultados, en los cuales 
el primer y segundo elemento del par representan los resultados al 
tirar el dado imparcial y el cargado respectivamente. Estas apa- 
recen a continuación con las probabilidades marcadas. 
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Debido a que los eventos “X = r” y “Y = s” son estadísticamente in- 
dependientes, las probabilidades en esta tabla han sido obtenidas por 
multiplicación. Por ejemplo 


PX =1;Y=1)=P(X =1)x PY=1)=+4xi=% 


3 
Sumando las probabilidades de las tres secciones de la tabla, encontra- 
mos que 


PX > Y) = 4, 
PX =Y=%x3, 
Px<vYn)=%, 


donde, por ejemplo, P(X > Y) es la probabilidad de que la realización 
de X sea superior a la realización de Y. 
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Ecuaciones (1) 


La suma de estas probabilidades es 1, ello indica que los 3 eventos se 
excluyen mutuamente y agotan todos los resultados posibles del en- 
sayo. 

Las ecuaciones (1) muestran cómo un dado imparcial es “mejor” que 
uno cargado por cuanto si ambos se tiran una sola vez, las posibilida- 
des de obtener un resultado superior con el dado imparcial son mayores 
que con el dado cargado. 


Esto apoya la conclusión a la que llegamos en (ii), y esto es posible- 
mente lo que se esperaba; pero no es todo tan “evidente”. La media 
más alta no es necesariamente índice de que tenemos más posibilidades 
de obtener un puntaje más alto con el dado imparcial (véase el ejercicio 
siguiente). nl 


Ejercicio 4 
Sea X el resultado obtenido con un dado cargado, donde la distribu- 
ción de probabilidad de X está dada por: 


PX=r)=j  (r=1,2,3) 


PX =r)= ME=4o5 O): 


Sea Y el resultado obtenido con otro dado cargado cuya distribución 
de la probabilidad está dada por: 


PY=5r)=% (r=2,3) 


P(Y =r)=3k4 (mi 1, 4,5, 6). 


Demuestre que si se tira cada dado dos veces, las posibilidades de ob- 
tener el resultado más alto con el primer dado son menores con relación 
al segundo dado, pero que el valor esperado del resultado para el pri- 
mer dado es superior al del segundo. [El 


Resumen 


Hemos aprendido en esta sección que no es siempre posible escoger, en 
forma inmediata, entre dos distribuciones, debido a que puede haber 
más de una medida apropiada a la situación. Pero si está claro el sig- 
nificado de “mejor” es posible encontrar sólo una característica de la 
distribución que pueda ser utilizada como un criterio para la elección. 
En nuestro ejemplo 1 esta medida sencilla fue la media de la distribu- 
ción. En otras circunstancias, la medida sencilla más apropiada puede 
ser la varianza de la distribución. Aunque estas dos medidas no agotan 
las posibilidades, ellas son las más usadas. 


Sin embargo, una consideración de la media nos puede desorientar (co- 
mo lo vimos en el ejercicio 4); es más seguro referirse a cualquier me- 
dida estándar sencilla como indicadora de la conclusión correcta en 
lugar de fijarla por encima de toda duda. En estadística es siempre pe- 
ligroso aplicar ciegamente técnicas estándar. 
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(3 minutos) 


Resumen 
* 
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Solución 4 Solución 4 


Para X y Y solamente, las distribuciones de probabilidad están dadas 
por: 


Y 
1 2 3 4 $ 6 
1 1 35. 35 1 1 1 
576 88 2388 376 376 376 
> 35 5 35 1 1 1 
L£ y 88: 288 316 376 5316 
1 A | 1 1 , 
3 37% 288: 288: 376 3%6 37 x<Y 
X 4: E A 
1128 864 863 ' 1528: 1728 1728 
ino e dl ES 1 
1728 des 864 1728' 1728; 1728 
ú A as. 35 1 o: 
1778 364 364 1728 1728: 1728 
A A X= Y 
> O 


De la tabla deducimos que 
PX > Y)=3% 
P(X < Y = $5 


y vemos por tanto que P(X > Y) < P(X < Y), aunque E(X) > E(Y). 


ES 
21.2 EL MUESTREO Y SUS CONSECUENCIAS 21.2 
21.2.1 Muestreo aleatorio 212.1 
Si tiramos un dado y estamos seguros de su imparcialidad, tendremos Discusión 
un modelo de probabilidad de la situación y podremos predecir los re- dei 


sultados. Por otro lado, es posible que surja el interrogante “¿Es real- 
mente imparcial?”. Un conocimiento de la clase de resultados que 
obtendremos al tirar tanto el dado imparcial como el cargado sería de 
gran ayuda para responder a esta pregunta. Cómo se presta esta ayuda 
lo determina la teoría estadística. 


Para indagar sobre esta pregunta, tendríamos que experimentar con el 
dado tirándolo cierto número de veces. Los resultados posibles en cual- 
quier ensayo sencillo son los números 1, 2, 3,4576: 


x, el resultado del primer ensayo; 
x. el resultado del segundo ensayo; 


x, el resultado del n ensayo. 
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x, es el valor numérico tomado en el primer ensayo por la variable 
aleatoria X; es la realización de X. Lo mismo se aplica a x,, etc. A la 
serie de valores x,, x,, ... , x,se le conoce como una muestra aleatoria 
que parte de la distribución de probabilidad de X. Es importante ob- 
servar dos de las propiedades de las muestras aleatorias: 


(i) cada valor muestral x, es la realización de la misma variable alea- 
toria X; 

(1i) las realizaciones de cada uno de los ensayos son físicamente inde- 
pendientes; y en consecuencia son estadísticamente independientes 
(Unidad 18). 

Entonces P(X = x, en el primer ensayo; X = x, en el segundo) 

= P(X = x, en el primer ensayo) x P(X = x., en el segundo) 
= PX = y) >, PX == 2) : 

en vista de que X tiene la misma distribución de probabilidad en todos 

los ensayos. Para toda la muestra la probabilidad de obtener la serie 

A 


PX <= x) x P(X =x9) xx PX =x) 


Las observaciones (i) y (ii) se pueden aplicar a cualquier variable alea- 
toria definida sobre cualquier espacio muestral finito. 


El concepto de muestra aleatoria ha sido, hasta el momento, expresado 
en términos de una serie de ensayos idénticos e independientes, por 
ejemplo un dado que se tira n veces. El mismo modelo se aplica de 
igual forma a un conjunto de ensayos simultáneos, idénticos e indepen- 
dientes; por ejemplo, n dados diferenciables entre sí y tirados al tiempo. 
Es con frecuencia conveniente referirse a la muestra aleatoria x,, Mos 

- , X, Como si cada observación x, fuera una realización de una va- 
riable aleatoria X, diferente. Así obtenemos n variables aleatorias todas 
con la misma distribución de probabilidad. Estas dos formas de mirar 
una muestra aleatoria son equivalentes. La segunda es generalmente la 
más utilizada desde el punto de vista matemático. 


Aleatoriedad, como independencia, ha sido expresada puramente en 
términos matemáticos. Para lograr observaciones que pueden razona- 
blemente estar en conformidad con ella, es necesario tomar, casi siem- 
pre, ciertas precauciones. Estas precauciones pueden ser obvias para 
un buen experimentador; por ejemplo, un químico que esté haciendo 
una serie de determinaciones químicas lavará los tubos de ensayo para 
evitar cualquier riesgo de contaminación entre los experimentos. Por 
otro lado, es posible que dichas precauciones necesiten ser más sutiles, 
o aun pueden ser imposibles de llevar a cabo. Por ejemplo, en tres ate- 
rrizajes consecutivos de un avión es imposible que el riesgo de que falle 
una llanta sea exactamente el mismo en cada ocasión (hay que tener 
en cuenta el desgaste de la llanta o la fatiga del piloto). Se puede, sin 
embargo, cambiando la llanta y/o el piloto, arreglar el experimento de 
tal forma que 3 observaciones que se hagan permitan considerar, con 
razón, que se trata de una muestra aleatoria de la población que nos 
interesa. 


Ejercicio 1 
(i) Un dado imparcial se tira dos veces. Escriba todas las muestras 
aleatorias posibles, junto con sus probabilidades. (Cada muestra 
aleatoria es, desde luego, una serie de dos elementos). 
(1i) Se tiran simultáneamente dos dados imparciales indiferenciables 
entre sí. ¿Qué diferencia, si existe, establece este hecho con los re- 
sultados obtenidos en (i)? 
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...». 


Ejercicio 1 
(3 minutos) 


(iii) Un experimentador tira dos veces un dado imparcial, y registra el 
resultado más alto (o el resultado común a ambos si es igual). Los 
tira una segunda vez y registra nuevamente el resultado mayor. 
Al final termina con una serie de dos resultados registrados. Escri- 
ba todas las muestras aleatorias posibles y sus probabilidades. Mi 


El ejercicio 1 es tan parecido al ejemplo 21.1.2.1 de la página 7 que 
usted se debe estar preguntando si la definición de muestra aleatoria 
realmente introduce algo nuevo. Para ayudarlo a comprender la im- 
portancia del concepto de muestra aleatoria, veamos cómo se pueden 
construir muestras aleatorias partiendo de distribuciones de probabili- 
dad conocidas que utilizan números aleatorios. 


Supóngase que conocemos el espacio muestral de un experimento, pero 
no conocemos cuál sería la serie de resultados en caso de llevar a cabo 
varias veces el experimento. Si queremos impulsar el experimento, ne- 
cesitamos un método para producir dicha serie de tal forma que refleje 
la aleatoriedad del experimento y las probabilidades asignadas a cada 
uno de los posibles resultados del experimento. 


Supóngase que tenemos una variable aleatoria X que puede tomar los 


valores a,, a,, ... ,4, y la distribución de probabilidad de X está dada 
por 

P(X = a, => (re 1,2: Ñ 
donde b,, b., ... , b, son enteros positivos y c es la suma de ellos. 


Una tabla de números aleatorios consiste en una serie de dígitos obte- 
nidos en forma equivalente a tirar sucesivamente un dado imparcial de 
diez lados cuyas caras están numeradas 0, 1, 2, ..., 9. Supongamos 
que c < 10. Entonces, para obtener una muestra aleatoria, X,, X», ..., 
x,, partiendo de la distribución de probabilidad, leemos n dígitos suce- 
sivos de los números aleatorios. Si n, es el r-ésimo de dicho número 


aleatorio, entonces 
si0<n,<b,-=1 tomamos x, = 4,; 


sib, <n,<b,+b,-=1 tomamos x, = 4; 
sib, +b,<n,<b,+b,+b3-— 1 tomamos x, = 43; 


y así sucesivamente. Si cualquiera de los números sacados de la tabla 
es mayor o igual a c lo ignoramos, y continuamos con el número alea- 
torio siguiente. 


Ejemplo 1 
La siguiente es una tabla de 100 dígitos aleatorios: 
4620535 767.9 9 


1317361431 
132333734388 
51985309897 
67707458879 
21337491020 
191818460.2 
441922139386 
611370648153 
633 reraDls 
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Discusión 
». » 


Ejemplo 1 


Sea X la variable aleatoria correspondiente a la tirada de un dado im- 
parcial de manera que 


a=r (r= 1124.56) 
P(X =a,) =1 


En la notación que introdujimos anteriormente, tenemos 


bi ="1 (r = 1,2,...... 6) 
c=6 


Utilizando las reglas anteriores obtenemos una muestra aleatoria. El 
primer número aleatorio en la tabla es n, = 4, y 


4=b,+b3+b3+b,¿<m<Sb,+b3+b3+b¿+b,-1, 


de manera que x, es el primer elemento en nuestra serie y tiene un va- 
lor de 5. El segundo número aleatorio es 6 y, de acuerdo con nuestras 
instrucciones, lo ignoramos. En general, si n, < c, encontramos que 
x, = n, + 1, y obtenemos la muestra aleatoria 


Sy 160, 2 A his [E] 


Si 10 < c < 100, debemos obtener de la tabla números aleatorios de 
dos dígitos; esto se logra leyendo los dígitos aleatorios por pares. 
Aparte de esta modificación, las instrucciones anteriores siguen en pie. 
No se debe abusar en la utilización de métodos abreviados. Si utiliza- 
mos el método descrito anteriormente para construir muestras aleato- 
rias partiendo de la distribución dada por 


P(X =0) = 
P(X =1)= 


ob ua 


tenemos que c = 5, y la mitad de los números en la tabla aleatoria 
quedan sin ser utilizados. En este caso es mejor expresar nuevamente 
las probabilidades como 


Ahora tenemos que c = 10; con este valor de c es menor la cantidad 
de números que quedan sin ser utilizados, si comparamos con el pro- 
ceso anterior, a la vez que es más fácil de aplicar. 


Una versión más sofisticada de esta técnica, muy apropiada para utili- 
zar en computadores, se utiliza bajo el nombre de simulación, ella exa- 
mina las consecuencias de los modelos de probabilidad en situaciones 
donde los cálculos son muy complicados; también juega un papel me- 
nor en la historia de la teoría estadística en vista de que algunos de los 
resultados estándar, ahora establecidos matemáticamente, se obtuvie- 
ron inicialmente por este procedimiento. 


El ejercicio siguiente intenta mostrar cómo una muestra pequeña pue- 
de no ser la adecuada para distinguir entre dos modelos de probabilidad. 
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(continúa en la página 27) 


MB 21.2.1 
Solución 21.2.1.1 Solución 21.2.1.1 


(i) Esta solución se dio al comienzo de la Sección 21.1.2 (pág. 7). 

(ii) La única diferencia aquí es que en este ejemplo no existe distinción 
entre los dados; es decir, una muestra aleatoria es una serie con 
un solo elemento, dicho elemento es un par de números (no un par 
ordenado); entonces escribimos el elemento que consiste en los nú- 
meros a y b como el conjunto (a, b)*. 


a 12 4 (19 15 1 
22 44 Ban 

an A ES yo 

a 

yr > 

(6.6) 


(iii) Para poder comprender el patrón general, debemos considerar al- 
gunos casos especiales: 


primer tiro segundo tiro serie aleatoria 
dado A | dado B| dado A | dado B 

l, 1 1 1 1,1 

1 1 1 2 ¡E 

1 1 2 1 1,2 

1 1 2 2 1,2 


La serie aleatoria 1, 1 sólo se puede obtener de una manera; la serie 
aleatoria 1, 2 se puede obtener de 3 maneras; y así sucesivamente. En 
vista de que cada experimento comprende 4 tiros, la serie 1, 1 tiene una 
pobabilidad de ¿;; la serie 1, 2 tiene una probabilidad de 4; etc. 
Las muestras con sus probabilidades son: 


Ll 13 13 14 15 Li 
Tios 1d06 Tios Ti08 1305 12% 
21 11 215.44 25 26 
rá vis Ts 18 13 1 
sl 1% 33 34 15 38 
ría 18 18 18% 1258 118 
4,1 4,2 453 44 45 4,6 
míos 10 18 118 15 12 
51:32 53 5433 55 
ríos 1% 18 158% 105 12 
6,1 6,2 6,3 6,4 6,5 6,6 
de 1 18 13 195 1Í5 » 


* En la Unidad 1, Funciones vimos que, al hacer una lista de los elementos de un conjunto, 
no registramos repeticiones. “Repeticiones” en dicho contexto se refería a “repeticiones 
innecesarias”; en este contexto escribimos el elemento que consta de un par de números 
a y a como (a, a). 
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(continuación de la página 25) 
Ejercicio 2 
Utilice los números aleatorios dados en el ejemplo 1 para obtener: 


(i) una muestra aleatoria formada por 20 resultados obtenidos con un 
dado imparcial (véase el ejemplo 1); 


(ii) una muestra aleatoria que conste de 20 resultados obtenidos con un 
dado cargado, cuya distribución de probabilidad está dada por: 


P(X = 1) = P(X = 6) =14 
P(X = 2) = P(X = 3) = P(X =4) =P(X =5)=3, 


En este segundo caso empiece leyendo los números aleatorios en el co- 
mienzo de la fila completa que sigue a donde dejó en (i), y tome 
c= 100. 


21.2.2 Estadística del muestreo y sus distribuciones 
Introducción 


Dada una muestra aleatoria x,, x,, ..., x, tomada de un espacio mues- 
tral, tendrá una media x. Si repitiéramos todo el experimento, tendría- 
mos otra muestra aleatoria x,,x,,...,x' con media x'. Podemos repe- 
tir todo el experimento un número infinito de veces, obteniendo más 
medias Xx”, x””, etc. Ahora obtuvimos la muestra Lo o. .5:X, hacien- 
do un ensayo n veces, el ensayo r nos dio el valor x,. Si consideramos 
que estos n ensayos constituyen un solo “super-ensayo”, Y es el resul- 
tado de este super-ensayo. Otros super-ensayos nos dan los resultados 
Xx, X”, Xx”; pero esta situación no difiere de los ensayos corrientes; por 
tanto x. Y.x”.... son realizaciones de una variable aleatoria que puede 
ser representada por X. X es un caso especial de una estadística del 
muestreo, y a la distribución de probabilidad de X se hace referencia 
como distribución del muestreo. Esta nomenclatura hace referencia al 
proceso de muestreo que da origen a X, pero también tiene la ventaja 
de diferenciar a X de la variable aleatoria original X, y la distribución 
del muestreo de X de la distribución original (frecuentemente llamada 
patrón) de X. En otras palabras, los hijos de las distribuciones patro- 
nes son las distribuciones del muestreo. 


Estadística del muestreo 


En la notación introducida en el párrafo anterior podemos definir una 
función que delinea una muestra aleatoria Xi Xz, ... , Xx, con su media 
X. Generalizando, si existe una función 


del conjunto de todas las muestras aleatorias hasta R, entonces como 
en el caso particular de X, y es una realización de la variable aleatoria 
Ye llamada estadística del muestreo: La distribución de probabilidad de 
Y se denomina distribución del muestreo- La materia de la estadística 
matemática se interesa principalmente en la determinación de estas 
distribuciones del muestreo. 


Ejemplo 1 


Haciendo referencia al caso especial de la media, supóngase que tira- 
mos un dado imparcial 3 veces y estamos interesados en la media arit- 
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Ejercicio 2 
(2 minutos) 


21.2.2 


Introducción 
»” » 


Definición 1 
* $ + 
Definición 2 
Rh « 


Ejemplo 1 


(continúa en la página 28) 
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Solución 21.2.1.2 Solución 21.2.1.2 


(i) La muestra aleatoria es 
5,3,1,6,2,4,2,6,5,5,6,2,4,4, 3, 4, 4, 6, 4, 6. 


Esta muestra ha utilizado los primeros 31 dígitos. 
(ii) (Observe que si tomamos c = 20, no tendríamos suficientes dígitos 
restantes en la tabla.) 


e = 100, utilizamos simultáneamente dos dígitos de la tabla. 
Tenemos 


b, =20,b, =b,=b4=b5=15,b5=20 


a..= PF (== 1,2 ..6.0) 


Si b, = 20, para cualquier número n, de la tabla menor que o igual a 
19, tenemos 


0<n,<b,-1=19, yasí x, =a, =1. 


Procediendo en forma similar, es posible obtener la tabla: 


resultado 
0O<nm <19 1 
20 < n, < 34 2 
35 <n, < 49 3 
50 < n, < 64 4 
65 < n, < 79 5 
80 <n, <99 6 


Utilizamos los dígitos en pares comenzando en la quinta fila (usamos 
67,70, 74, ...) y la muestra aleatoria es 


5,5, 5,4,5,2,6,3,1,2,1,1,1,3,1,3, 1,2, 6, 6. 


La tabla siguiente muestra la frecuencia con la cual cada resultado 


aparece en la muestra aleatoria. 
=e PPP 
MEE 


ais Tp pd 


Los resultados para el dado cargado aparecen distribuidos en forma 
más pareja que los del dado imparcial. Estos números no fueron espe- 
cialmente escogidos para demostrar esta propiedad. 5 


(continuación de la página 27) 


mética de los valores x,, x., x, así obtenidos. En otras palabras estamos 
interesados en 


Xy $] Xy E Xg ES 
: . AA 
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y en la distribución del muestreo de X. Existen 6 valores posibles para 
cada uno de x,, x.,, x,, por tanto existen 6? = 216 muestras posibles. 
Unicamente la muestra 1, 1, 1, tiene el valor 1 como su media. Las 
muestras 2, 1, 1; 1,2, 1; 1, 1, 2 tienen todas una media de 3. A conti- 
nuación hemos delineado las muestras con sus medias 


Muestras aleatorias x 


Al evaluar las medias de cada uno de los 216 puntos muestrales y re- 
cordando que cada uno ocurre con una probabilidad de 715, €ncontra- 
mos que la distribución de probabilidad de la estadística del muestreo 
X es: 


Ejercicio 1 


Se tira un dado imparcial k veces y x,,,, es el resultado mayor de k así 
obtenido. Si X.,.. es la variable aleatoria que tiene x,,,, como su reali- 
zación, muestre que la distribución de X.... está dada por: 


k — 
Pon = 1) = [) -[! K (r= 1: ...6): 


6 6 
(SUGERENCIA: Determine primero las respuestas para X... = LL, 
luego para Xma, = 2, y así sucesivamente.) ls] 


La estadística del muestreo consiste simplemente en variables aleato- 
rias basadas en ejemplos aleatorios y no en los resultados de los ensa- 
yos individuales; además, no origina ideas esencialmente nuevas. Si, 
como en los casos sencillos que hemos considerado, se puede determinar 
la distribución completa del muestreo, entonces tendremos una informa- 
ción completa para hacer enunciados de probabilidad sobre la estadística 
del muestreo. En los casos complicados, no podemos obtener la distri- 
bución del muestreo, y tenemos que contentarnos con conocer única- 
mente su media y su varianza; algunas veces se hace referencia a estas 
medidas como la media muestral y la varianza muestral de la esta- 
dística. 


Las medidas para la distribución patrón y del muestreo no son inde- 
pendientes entre sí. Si observamos la media y la varianza de la distri- 
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Ejercicio 1 
(5 minutos) 


Discusión 
 * 
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Solución 1 Solución 1 


P(X ... = 1) = P (todos los resultados de k son iguales a 1) 


PX ma. = 2) = PIX max < 2) — PX max = 1) 


1 k 
= Pítodos los resultados de k son < 2) — (5) 


En forma similar 


PX max = 3) = PlXm < 3) — P(X max < 2) 


ax 


En general, 


PlA max = rr) = Pla E 1) — Ala 1) 


(continuación de la página 29) 


bución del muestreo del resultado promedio para 3 tiros de un dado 
imparcial (ejemplo 1), y utilizamos dicha distribución, obtenemos 


q ls 2268 
E(X%) = ox =2) ==7=35 
Zz 3 648 


Por tanto la media de la distribución del muestreo es la misma media 
(3,5) que obtuvimos en la página 14 para la distribución patrón. 


En este punto es bueno tener una idea clara de lo dicho hasta ahora 
para evitar una confusión verbal. Cualquier variable aleatoria X dada, 
tiene como media y = E(X). Dada una muestra aleatoria, la estadística 
del muestreo X (cuyas realizaciones son medias muestrales X) tiene una 
distribución de probabilidad cuya media es E(X). Luego, en cierto sen- 
tido tenemos la “media de la media”. No hay razón por la cual una 
realización determinada X no sea igual a 1; y no hemos visto razón hasta 
ahora para relacionar E(X) con p. Para el dado, sin embargo, hemos 
demostrado que para muestras de 3, E(X) = 3,5 = p. 


En forma similar, podemos calcular la media de la varianza muestral, 
o de la varianza de la media muestral. 
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Ejemplo 2 
Para tres tiros de un dado imparcial, encontramos que var (X) 


var (X) = E(X?) — y? (véase el ejercicio 21.1.4.3) 


9 1 16 3 25 6 
9 


ET 
34 1 _99 
9 “216 4 
_ 25704 49 
1944 4 
MES 
36 E 


Este resultado puede ser comparado con el resultado para la distribu- 
ción de probabilidad original de X, para el resultado de un dado im- 
parcial, donde se obtuvo var (X) = 3. (Véase el ejercicio 21.1.4.3 (ii)). 
Luego, tomando el promedio de una muestra de 3 observaciones, la va- 
rianza ha sido reducida por un factor de 3. Esto no es sólo una coinci- 
dencia; es un caso especial de una regla general sobre la varianza de la 
distribución del muestreo de la media. Veremos su importancia práctica 
en la Sección 21.2.3, donde estudiaremos la estimación de valores. 


Los cálculos de la media y de la varianza de X, en un caso sencillo como 
- éste, sugieren ciertas propiedades generales. Estas propiedades no se 
probarán en esta unidad, pero las enumeramos aquí. 


SiE(X) = 1. y var(X) = 07, 


entonces para una muestra aleatoria cuya dimensión es n, 


a EPA 
E(X) = p y var(X) = e 


En vista de que la varianza se utiliza como medida de dispersión, estos 
resultados implican que las realizaciones de X están más estrechamente 
agrupadas y por tanto se acercan a y a medida que aumenta n. 


Parte del material de esta sección y de otras anteriores se resume a 
continuación. 


(i) Una variable aleatoria X tiene realizaciones a,, a., ... , a,, ellas 
son posibles resultados numéricos de un solo ensayo. 

(ii) Una estadística del muestreo es una variable aleatoria asociada con 
una muestra aleatoria; es alguna función A definida sobre un con- 


junto de ejemplos aleatorios. 
EX) o u 
X 


(iii) valor esperado de 
X = media de la 
distribución de X 


(iv) media de x,,xX., ...,x, 
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Ejemplo 2 


Resumen 
».». 


representado por 


(v) media de las variables 
aleatorias X,, ...,X, 


(vi) varianza de X,,X», ..,X, 


(vii) varianza de X a? o var(X) 

(viii) media de la media EX) 

muestral 

(ix) varianza de la media as var (X) 
muestral 


* Estos dos resultados han sido citados sin pruebas. 


21.2.3 Modelos paramétricos y estadística como 
medios de evaluación 


Hasta ahora hemos supuesto que conocemos las probabilidades de 
los resultados en el espacio muestral correspondiente a un solo en- 
sayo. Hemos supuesto que un dado determinado es imparcial o que si 
está cargado conocemos el sentido de su parcialización; que la probabi- 
lidad de que falle la llanta de un avión es conocida, etc. En la vida real 
se desconoce la naturaleza de la parcialización en un dado o la probabi- 
lidad de falla de una llanta. Es precisamente sobre estos datos desco- 
nocidos sobre los cuales esperamos obtener información por medio de 
nuestras observaciones. Para ello debemos antes que todo, construir 
modelos en los cuales un enunciado como “el dado está cargado” se 
haga más específico. Esto se logra generalmente introduciendo uno o 
más parámetros. 


Si no sabemos nada acerca del dado, todo lo que podemos decir sobre la 
variable aleatoria correspondiente al resultado, es que satisface 


PX =r)=p, (r=1,2..., 6) 


donde 0O<p,<1 y Y p,=1; 


Pr Pa, -.- , P4 SON los llamados parámetros del sistema y son constan- 
tes en cualquier situación (por ejemplo, para el mismo dado tirado en 
la misma forma), aunque sus valores los desconocemos. La distribución 
anteriormente definida es nuestro modelo de probabilidad de la situa- 
ción. Observe que los modelos no tienen que ser necesariamente exac- 
tos en todos sus detalles. En los puntos de una gráfica, un científico no 
necesariamente halla una curva perfecta, habrá puntos que quedan 
fuera de la gráfica trazada. Si las informaciones parecen garantizarlo, 
debe formar una línea recta que representa la dirección principal indi- 
cada por los puntos. En nuestro caso tratamos de utilizar cualquier 
información sobre el sistema físico para reducir el número de paráme- 
tros. 
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21.2.3 


Discusión 


Definición 1 
. 


Por ejemplo, supongamos que tenemos un dado que es casi seguro que 
esté parcializado porque el 6 no ocurre una sola vez en seis en una larga 
serie de ensayos, aunque todos los demás resultados aparecen con igual 
frecuencia. Si tomamos la probabilidad de 6 como P y las probabilida- 
des de todos los otros números como iguales (o aproximadamente igua- 
les), entonces el modelo apropiado para tomar es la distribución dada 
por 


PLA“ =6)= p 
RE == === r= 2.049) 


Por otra parte, puede que conozcamos algo de la construcción del dado 
y podemos pensar que el modelo siguiente es más exacto: 


P(X = 6) =p 
P(X =r)=1 (r = 2,3, 4, 5) 
P(X =1)=1-p 


donde 0 < p < 4 pero p es desconocido. 


Ambos modelos tienen un solo parámetro, porque hemos tenido en 
cuenta nuestro conocimiento del sistema. (En forma muy similar, un 
científico puede trazar una línea recta en un conjunto de puntos por- 
que determinado razonamiento lo lleva a esperar una línea recta, y el 
objeto de este experimento es encontrar una línea determinada y no 
cualquier curva que coincida con los datos). 


En general, el problema de escoger un modelo apropiado requiere un 
conocimiento básico muy amplio sobre las condiciones físicas del expe- 
rimento, así como también experiencia ante situaciones físicas análo- 
gas. La utilización de los métodos estadísticos estándar opaca con 
frecuencia la necesidad de examinar la adecuacidad del modelo. 


La determinación de una distribución del muestreo de una estadística 
basada en observaciones de un modelo paramétrico no presenta, en 
principio, nuevos problemas. Lo que es nuevo en la situación es que no 
es de mucha utilidad el tener en cuenta la estadística a menos que esta 
suministre alguna información sobre el valor del parámetro. De una 
muestra particular es posible computar muchas estadísticas del mues- 
treo diferentes, y la naturaleza de la información que provee cualquier 
estadística particular sobre el parámetro solo puede ser determinada 
partiendo de la distribución del muestreo. El primer papel que juegan 
las distribuciones del muestreo en la teoría estadística está en la com- 
paración de la estadística del muestreo como estimativos del pará- 
metro (o parámetros) en el modelo. 


Ejemplo 1 


Como ejemplo, consideremos una situación que a primera vista puede 
aparecer moldeada por un dado imparcial de N-lados, donde N se des- 
conoce. Supóngase que un enemigo está fabricando equipos de guerra y 
cada uno de ellos recibe un número de serie. Supongamos que estos 
números de serie van de 1 a N, los agentes de inteligencia obtienen los 
números de serie de n de estas piezas, y se requiere información sobre N > 
el número total de piezas elaboradas. A su vez, supongamos que un 
falsificador elaboró una serie de billetes que va de l a N, una vez se 
dieron cuenta de esta falsificación el banco de Inglaterra quizo saber 
cuántos billetes falsos estaban en circulación. Una vez más, la informa- 


33 


MB 21.2.3 


Ejemplo 1 


ción sobre N hay que obtenerla de los números de serie de n billetes 
que han sido detectados como falsificaciones. 


Es razonable suponer que en cada una de estas situaciones todos los 
números de serie existentes tienen la misma posibilidad de ser encon- 
trados. (Esta suposición puede ser falsa, pero una vez más nos encon- 
tramos con el eterno problema del estadígrafo. ¿Qué otra suposición 
podemos hacer?) Estamos suponiendo que no hay dos elementos con 
el mismo número de serie: esta no es exactamente la situación descrita 
por el dado ya que con el dado podemos obtener dos veces el mismo 
resultado. Si, por ejemplo, hacemos de cuenta que todos los números de 
serie están escritos sobre cartas que pueden ser barajadas para luego 
sacar una por una, entonces la situación con que estamos tratando es 
una muestra aleatoria sin remplazamiento, mientras el tirar un dado 
corresponde a una muestra aleatoria con remplazamiento. (La selec- 
ción aleatoria con o sin remplazamiento se discutió en la Unidad 18.) 
En cada una de estas situaciones, sin embargo, N es un parámetro; es 
un desconocido cuyo valor tiene que ser especificado si las predicciones 
de probabilidad exactas del resultado de un experimento se deben hacer. 
En el contexto estadístico es algo que queremos estimar partiendo de 
las informaciones obtenidas. La forma como un estadígrafo hace esto 
es tomando la realización de la estadística del muestreo cuya distribu- 
ción está en cierto sentido estrechamente agrupada alrededor del valor 
real de N. A una estadística del muestreo con esta propiedad se le dice 
que es un tasador del parámetro. 


Para ilustrar la clase de consideraciones que entrarían en nuestra selec- 
ción de dicha estadística, supóngase que obtenemos dos números en 
serie, x, y x.. Se supone que este par de números representan una mues- 
tra aleatoria. Como el primer intento lógico para estimar N, considere 


En Xy F Xa 


«el promedio: x = ; esta es una realización de una estadística 


del muestreo X. Los valores posibles que puede tomar esta estadística 


345 2N —- 1 do 7 
son: 53 pue TA La distribución del muestreo se puede obtener 
con argumentos relativamente sencillos, pero el trabajo es monótono. 
(Por ejemplo, para determinar E(X) tendríamos que encontrar todos 
los valores posibles de X para luego hallar sus probabilidades asociadas. 
Las probabilidades se pueden calcular partiendo del hecho de que hay 
1 


N(N — 1) pares posibles, cada uno con una probabilidad: NN 1 
Enumeremos simplemente los resultados que deseamos, a saber: 
A. PEL 
z 
2 
Exa) = NH MIN +4 
24 
de manera que 
2 y 2 
mal + AN 4d 1) 
24 4 
_ NN-2 
E 24 


Ahora los números en serie tienen una distribución cuya variable alea- 


Ñ N+1 E 
toria es X, y la media de X es A Más adelante tenemos la distri- 
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Definición 2 


*h $ * 


A + ¿0% . N+1 
bución del muestreo de X, y esta también tiene como media > A 


continuación podemos pensar o en nuestra Y numérica como la media 
de la muestra* de 2 desde la distribución original, o como la muestra 
de 1 desde la distribución del muestreo de X; las dos suman exactamen- 
te lo mismo al final, porque en cada caso estamos “igualando” mental- 


a N+1 Ñ mi 
mente x con -——. Pero si estamos preparados para tomar X como 
N+1 

Z 
2x como nuestra estimación de N + 1, y por tanto 2% — 1 como nues- 
tra estimación de N. La variable aleatoria que tiene 2% — 1 como su 
realización es 2X — 1; representando esta por Ñ, estamos utilizando 
la estadística del muestreo Ñ = 2X — 1 para estimar N. 


nuestra estimación de , debemos estar preparados para tomar 


Ya en este momento nos debemos haber percatado de la situación. Ade- 
más de N(N — 1) pares posibles de números en serie hemos obtenido 
uno, y hemos tomado la media, x, de los dos números que constituyen 
el par. Si repitiéramos todo el proceso desde el principio (recuerde que 
estamos hablando de muestreo sin remplazamiento), obtendríamos una 
media xX,. En la ocasión n la media sería x,. Estos valores de Ras as 
. . +. y X,, son realizaciones de la estadística del muestreo X. Hemos to- 
mado Ñ = 2X -— 1 y sabemos que su valor esperado es igual a N. Aun- 
que la realización de Ñ no es necesariamente igual a N, ella está en 
cierto sentido centrada sobre N, siendo N el valor esperado de Ñ. 


AN nc ii . N+1 
X está simétricamente distribuida sobre el valor de su media E—, 


de tal forma que X también está simétricamente distribuida alrededor 


s 1 Pr = . ; 
del valor de su media . Por tanto Ñ = 2X — 1 está simétrica- 


mente distribuida alrededor del valor de la media de N. En conclusión 
N tiene iguales posibilidades de ser demasiado pequeña para cierta 
cantidad, como las tiene de ser demasiado grande para esa misma can- 
tidad. Esta sería una propiedad deseable para un tasador. 


Hemos discutido que: 
el valor de la media de Ñ es N; 
Ñ está simétricamente distribuida alrededor de N. 


Sabemos también que var (Ñ) = 


= var(2X — 1) = 4 var(X) (véase el ejercicio 21.1.4.3.) 
NE Ned . da 
= A (repórtese a la página 34) 


la cual nos da una medida de la dispersión de NÑ. 


Otra estadística cuya distribución del muestreo se puede deducir fácil- 
mente es X* = max (X,, X,). De la serie de ejemplos posibles podemos 
obtener la distribución del muestreo de X* y trabajar luego la media y 
la varianza de X*; estas están dadas por 


Ex») = 0 + 1) 
3 
N?-N-2 
e E 
var (X*) = 18 


* Recuerde que nos estamos refiriendo al muestreo con remplazamiento. 
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Por las mismas razones anteriores, estaríamos preparados para aceptar 
_ AN+1) 
> 
Se sigue que aceptaríamos ¿x* — 1 como una estimación de N. Esta 
estimación es una realización de la variable aleatoria N* = ¿3X* — 1, 
cuya media es 

E(N*) = N 


y su varianza 


x* (una realización de X*) como una estimación de E£(X*) 


var (N*) = var (3X* — 1) 
=%2¿var(X*) 
(N? — N — 2) 
8 


Ahora tenemos dos estimaciones diferentes de N, ambas parecen ser 
razonables. ¿Hay algo qué escoger entre ellas? Ambas tienen como me- 
dia N, por tanto no hay nada qué escoger entre ellas. Sin embargo, 


N?-N-— 
var (Ñ) = Md st 
6 
y 
12 =>? 
var (N*) = > 


Ahora la varianza es una medida de dispersión, por tanto entre más 
pequeña la varianza más compacta la distribución, y más cerca de la 
media se hallarán los valores de la distribución. Sabemos que var (N*) = 
3 var (N), por tanto N* tiende a dar una estimación más correcta que 
Ñ, eso hace que N* sea un mejor tasador que Ñ. 


Otros dos puntos de comparación entre Ñ y N* y que vale la pena citar 
son: 


(i) Ñ toma únicamente valores enteros; N* puede tomar valores frac- 
cionados. Esto no excluye a N* como tasador. 
(ii) La distribución de ÑN es simétrica, la de N* no lo es. a 


Resumiendo los puntos generales sobre los procedimientos estadísticos 
que este ejemplo ilustra, vemos que una comparación de la utilidad de 
la estadística del muestreo al suministrar información sobre un pará- 
metro se reduce a una comparación de sus distribuciones del muestreo. 
Deliberadamente, no hemos citado reglas para esta comparación, pues- 
. to que lo importante en una comparación puede no serlo en otra. Por 
ejemplo, si necesitáramos que la distribución del muestreo de la estima- 
ción fuera simétrica alrededor de N, de las dos estadísticas Ñ y N* hu- 
biéramos tenido que escoger Ñ como tasador, aunque no se acerca tan- 
to a N como lo hace N*. 


Estas observaciones le darán una idea de los tipos de consideraciones 
que debe confrontar un estadígrafo. Ellas no intentan suministrar un 
estudio completo de la estimación ni de las propiedades “buenas” que 
las estimaciones (o mejor dicho sus distribuciones del muestreo) deben 
satisfacer. En cualquier evento, en algunas situaciones tenemos que 
conformarnos con algo menos de lo mejor, porque la teoría para lo me- 
jor es demasiado difícil de manejar. 
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21.3 LA DISTRIBUCION BINOMIAL 
21.3.0 Introducción 


Son muchas las situaciones en las cuales un evento tiene cierta probabi- 
lidad de ocurrir, y en las cuales estamos interesados en conocer el nú- 
mero de éxitos en una serie de ensayos. Suponiendo que la probabili- 
dad de que un recién nacido sea hombre es 4, podemos investigar la 
probabilidad de que exista un número determinado de hombres en una 
familia formada por n personas. También podríamos estar interesados 
en la probabilidad de obtener una cantidad determinada de 6 en n tiros 
de un dado parcializado. Desde el punto de vista matemático estas dos 
situaciones son equivalentes; en cada caso tenemos 


P(““éxito”) = p . 
en un solo tiro, 
P(“falla”) = 1 — p 
y estamos interesados en la probabilidad de r éxitos en una serie de n 
ensayos independientes. 


Si X es la variable aleatoria correspondiente al número de éxitos en un 
solo ensayo, entonces la distribución de probabilidad de X está dada 
por: 


PX =1)=p 
MA =0l=1 =p 
Supongamos que tomamos una muestra x,, ... ,x, de esta distribución. 


Si cada una de las x es 0 ó 1, el número total de éxitos en esta mues- 
tra es 


L=X + be. +x 
Ahora t, es una realización de la variable aleatoria 

E=sK, iia Rs 
ello hace que estemos interesados en la distribución de T,, la cual es 


una estadística del muestreo. En otras palabras, estamos interesados 
una vez más en una distribución del muestreo. 


21.3.1 Deducción de la distribución 


Empecemos modestamente con n = 2. 


Representando el éxito con S, y el éxito seguido de una falla por SF, 
etc., tenemos 


P(S) = p 
P(E)= 1 =p 
ASS) = p? 
P(SF) = p(l — p) 
P(FS) = (1 — plp 
PEF) = (1 — pY 
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21.3 
21.3.0 


Introducción 
* * 


21.3.1 


Tema principal 


* * 
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Por consiguiente 


P(T, = 0) = P(FF) = (1 — py? 
P(T, = 1) = P(SF) + P(FS) = 2p(1 — p) 
P(T, = 2) = P(SS) = p? 


En forma similar, para los tres ensayos tenemos 


P(FFF) = (1 — p) P(FSS) = pY(1 — p) 

P(FFS) = p(1 — p?  P(SES)= p*(1 — p) 

P(FSF) = p(1 — p?  P(SSF) = p*(1 — p) 

P(SFF) = p(1 — py? P(SSS) = p? 
de manera que 

P(T, = 0) = (1 — py 

P(T, = 1) = 3p(1 — p)? 

P(T, = 2) = 3pX(1 — p) 

P(T, = 3) = p? 
Ya se debe observar (aunque todavía no se ha probado) que si una se- 
cuencia determinada contiene r éxitos y n—r fallas, su probabilidad 
dará p'(1 — p)””". ¿Cuántas secuencias hay que contienen r éxitos y 


n — r fallas? Mirémoslo así. Podemos llegar a dicha secuencia escri- 
biendo una cadena de n círculos. 


y escribiendo luego S (éxito) dentro de r círculos y F (falla) dentro de 
los círculos n — r restantes. Por ejemplo, 


90.0,0,0,0,... 


El número de secuencias es igual al número de posibilidades que exis- 
ten para seleccionar r elementos de n; esto es 


n n! 


r 


Cada secuencia tiene una probabilidad p'(1 — p)""" de ocurrir. Todas 
esas secuencias son diferentes, es decir, son exclusivas; por tanto la pro- 
babilidad de obtener r éxitos es igual a la probabilidad de obtener una 


y otra de las secuencias [”) , ella es 
Ñ a 
Ñ PU — pp", 
Así se llega a la distribución de probabilidad dada por 
n 
Pr, 0 =| Jero or> (r=:0,1, 2:52:10): 
ig 
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Como tenemos una distribución, esperaríamos que todas las probabili- 
dades del lado derecho se sumaran formando la unidad. Esto es así, al 
representar 1 — p por q tenemos 


Y WES 0] F ald = Y 
r=0 il 
= (p + q) (según el teorema de Newton) 
2 lp +qa 


Debido a la forma que toma esta distribución la denominamos distri- 
bución binomial, y decimos que 7, es la Variable aleatoria binomial. 


La distribución binomial ocurre con frecuencia. Anteriormente se ha- 
bló de una falla en las llantas de un avión. En dicho contexto si la llan- 
ta se hubiera reventado lo hubiéramos considerado un “éxito”, y el no 
reventarse hubiera sido una “falla”. La situación de los dos partidos 
ante la votación puede mirarse bajo el mismo punto de vista. Aquellos 
que votan conservador pueden considerarse como “éxitos” (o “fallas”), 
aunque es dudoso que los votos en una elección del momento puedan 
ser considerados como una muestra aleatoria de los votos potenciales 
de todo el electorado. Por otro lado, un escrutinio de opinión pública 
que escoge un número relativamente pequeño de personas para averi- 
guar sus puntos de vista políticos, puede obtener una muestra aleatoria 
de opiniones sobre las elecciones. Otro ejemplo se encuentra en el cam- 
po de la medicina, donde los pacientes tratados con droga o se recupe- 
ran o no. Observe que aunque el modelo básico ha sido descrito en tér- 
minos de una serie de ensayos, los ensayos pueden, en realidad, ser 
simultáneos. Por ejemplo, un grupo de pacientes hospitalarios pueden 
ser tratados simultáneamente con una misma droga. 


Ejercicio 1 


(i) Tomando p = 4, n = 6, determine la distribución binomial (o en- 


cuentre P(T, = r) parar =0,1,...,6). 
(ii) Determine la media y la varianza de la distribución 
PX =1)=p 


P(X =0)=1-p 


(i1i) Utilice el resultado de (ii) para demostrar que la variable aleatoria 
binomial T, tiene 


media np 


varianza  np(l — p). 


(SUGERENCIA: Utilice los resultados (viii) y (ix) de la tabla en la 
página 32). E 


21.3.2 Cálculo de una probabilidad desconocida 


Nuestros conceptos intuitivos sobre la probabilidad parten a la larga 
de la idea de frecuencia relativa. Por tanto para estimar la probabili- 
dad de algún evento, hemos tomado simplemente una serie de ensayos 


39 


MB 21.3.1, 21.3.2 


(Véase RB9) 


Definición 1 


* y $* 


Ejercicio 1 
(3 minutos) 


21.3.2 


Tema principal 


* * 


(continúa en la página 41) 
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Solución 21.3.1.1 Solución 21.3.1.1 


(i) P(T, =r) = [Po py"  donden=6yp=j4, 


[eL 
a r|3" 36-" 


E 6 26-" 
Nr] 729 
Luego P(T¿ = 0) = , a sa 
PRES lola” aa 
6.x-32. 192 
Ps =1)==239 7" 779 
15x 16 240 
PL = 2) ==—235—= 729 
20x8 160 
P(1s = 3) ==39 7 = 779 
¡E 60 
Ps = 4% ==72397— = 729 
6x2 12 
P(Ts = 5) ==297 = 799 
PT =6)= : 
s=6)=>73 
(11) EX) =1xp+0 x (1 — p) 
=P 
E(X?)=1xp+0x (1 - p) 
=p 
Por consiguiente, 
var (X) = p — p? 
= p(1 — p) 
(iii) T,=X,+X+:+X, 
de manera que 
Tr _X; EH +A _ 
n n 
y tenemos 
5) = EX) = EX) de la tabla 
n 6 
=p de (ii), 
de ahí que 
E(T,) = np (véase el ejercicio 21.1.4.3). 
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De manera similar, 


var El = var (X) = 0?/n de la tabla 
n 
HA como 0? = var (X) = p(l — p). 
Por tanto 
var (T,) =n? x pl» (véase el ejercicio 21.1.4.3). 
n 


= mp(1 — p) El 


¡hoz _—_—_—_—___—_ A 
(continuación de la página 39) 


independientes, y determinado la frecuencia relativa de ocurrencias. 
Ahora estamos en mejor posición para apreciar lo que está sucediendo 
realmente, y explicar por qué procesos más largos tienden a dar mejo- 
res estimaciones. 


Si X es una variable aleatoria que representa el número (1 6 0) de ocu- 
rrencias del evento en un solo ensayo, entonces 


P(X =1)=p 
PX=0)=1-p 


Esto nos da una distribución en la cual p es el parámetro. Por consi- 
guiente, el calcular esta probabilidad desconocida es un ejemplo de 
estimación paramétrica. Ello hace que necesitemos una estadística del 
muestreo apropiada. 


Si x, es el número de ocurrencias en el primer ensayo, x., las ocurren- 
cias del segundo, y así sucesivamente, el registro completo de resulta- 
dos X,, X., ... , x, constituye una muestra de la distribución de X. La 
estadística del muestreo 


ES AA 
tiene una media E(T,) = np (véase el ejercicio 21.3.1.1), y 
EN 
n 
hs : 
Por tanto debemos aceptar — = X como una estadística del muestreo 
n 


para calcular p, y la realización de X en nuestro caso es 


A 
n 


X= 


Al tratar de determinar cuán buen tasador puede ser una estadís- 
tica del muestreo debemos considerar la varianza de la estadística del - 
muestreo 


(=p) 


var (X) = A (véase el ejercicio 21.3.1.1), 
n 


de tal forma que si n aumenta, la varianza de la estadística del mues- 
treo disminuye, y mejora el tasador X. 
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Esto establece las matemáticas de la situación. Tomemos algunos ejem- 
plos numéricos y veamos cómo aumentos en n afectan la distribución 


T E 
del muestreo de = Al 
En general, tenemos 


de FP 


P=;) =P 


= É "(1 MA 
+1, Ju =p 
= Pp, (decir) 


Los diagramas siguientes representan las distribuciones del muestreo 
para n = 1,2, 5, 10 en los casos donde p = 3 y p = 3. Ellos son dia- 
gramas de barras de p, trazados contra r/n donde P(T,/n= r/n) = Pp. 


1 


en 2 p=3 
2 2 3 
1 1 
E z 
1 
3 
n=1 
+ EE 
o 1 [0] 1 
p=> p-3 


1 

32 

dl 

074441 OLEA 

p=3 p=3 
n=-10 || | 
el 
5 

O ó 1 O 5 1 


Es importante observar en estas distribuciones del muestreo cómo a 
medida que aumenta el tamaño de la muestra, la distribución se con- 
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centra más y más alrededor del valor “real” del parámetro p. Este es el 


s , ; T, 
resultado esperado con base en la discusión sobre la varianza de . 
n 


Ejercicio 1 


(i) Repórtese a la serie de CEROS (0) y UNOS (1) obtenida en la adi- 
vinanza de cartas de la Unidad 16, y divida los 500 términos en 50 
carreras que no se entrecrucen, de 10 términos cada una. Para cada 
carrera determine la frecuencia relativa de Uno y trace luego estas 
50 frecuencias relativas de alguna manera para ver cómo se agrupan. 
Repita este proceso pero con 20 carreras de 25 términos cada una, 
teniendo cuidado que no se entrecrucen. ¿Es mayor el agrupa- 
miento? 0 L 


=> 


(ii 


Post-escrito 


“Y ahora se trasporta expectación en el aire”. 


William Shakespeare 
Enrique V 
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M 100 — UNIDADES DEL CURSO BASICO DE MATEMATICAS 


0 J31D00+>0nNA 


Funciones 

Errores y exactitud 
Operaciones y morfismos 
Diferencias finitas 

NO HAY TEXTO 
Desiguales 

Sucesiones y límites 1 
Computación l 

Integración 1 

NO HAY TEXTO 

Lógica 1 — Algebra de Boole 
Diferenciación 1 
Integración II 

Sucesiones y límites II 
Diferenciación II 
Probabilidad y estadística I 
Lógica II — Prueba 
Probabilidad y estadística II 
Relaciones 

Computación Il 
Probabilidad y estadística II 
Algebra lineal 1 

Algebra lineal II 
Ecuaciones diferenciales 1 
NO HAY TEXTO 

Algebra lineal II 

Números complejos 1 
Algebra lineal IV 

Números complejos II 
Grupos 1 

Ecuaciones diferenciales II 
NO HAY TEXTO 

Grupos Il 

Sistemas numéricos 
Topología 

Estructuras matemáticas 
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